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本 书 是 当前 世界 上 最 为 流行 的 计算 机 网 络 教科 书 之 一 ， 采 用 作者 独创 的 自 项 向 下 方法 讲授 计算 机 网 络 的 原理 及 其 
协议 ， 即 从 应 用 层 协议 开始 沿 协议 栈 向 下 讲解 ， 让 读者 从 实现 、 应 用 的 角度 明白 各 层 的 意义 ， 强 调 应 用 层 范例 和 应 用 
编程 接口 ， 使 读者 尽快 进入 每 天 使 用 的 应 用 程序 环境 之 中 进行 学 习 和 “创造 ”。 

本 书 第 1 ~ 6 章 适 合作 为 高 等 院 校 计算 机 、 电 子 工程 等 相关 专业 本 科 生 “计算 机 网 络 ” 课 程 的 教材 ， 第 7 ~ 9 章 可 用 
于 硕士 研究 生 “高 级 计算 机 网 络 ” 课 程 教学 。 对 网 络 从 业者 、 有 一 定 网 络 基础 的 人 员 甚 至 专业 网 络 研究 人 员 ， 本 书 也 
定 一 本 优秀 的 参考 书 。 


主要 特点 

o 极 富 盛 名 的 “ 自 项 向 下 ”教学 法 。 特 别 强调 应 用 层 ， 尽 早 激发 读者 的 学 习 热情 并 强调 动手 开发 网 络 应 用 程序 . 

® 着 眼 原理 。 当 前 计算 机 网 络 领域 的 许多 基础 性 问题 已 经 研究 得 较为 清楚 ， 重 点 把 握 这 些 原则 ， 将 使 读者 获得 长 
“保质 期 ”的 知识 ,, 在 飞 滞 发 展 的 网 络 研究 开发 中 保持 判断 为 和 启发 创造 力 。 

@ 以 因特网 为 研究 对 象 。 本 书 以 因特网 体系 结构 的 5 层 模型 来 组 织 学 习 过 程 ， 学 以 致 用 ， 为 读者 的 学 习 热情 提供 了 
原动力 : 

o 注重 教学 法 。 精 心 编排 教学 内 容 ， 强 化 能 力 训练 ， 提 供 优质 课 后 资料 ， 教 学 手段 多 样 化 。 

o 及 时 更 新 教学 内 容 。 本 版 及 时 引入 重要 的 最 新 知识 并 舍弃 了 过 时 的 内 容 ， 例 如 用 Python 替代 了 Java 以 便 编 程 新 手 
更 易 理解 ， 更 新 了 路 由 器 体系 结构 的 章节 ， 反 映 了 近年 来 局 域 网 技术 的 发 展 变化 及 无 线 网 络 中 的 最 近 进展 ， 深 入 
讨论 了 流 式 视频 和 CDN 技 术 等 。 
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本 书 第 1 版 于 12 年 前 出 版 ， 首 创 采用 自 顶 向 下 的 方法 讲解 计算 机 网 络 的 原理 和 协议 ， 出 版 以 来 已 
被 几 百 所 大 学 和 学 院 选 用 ， 是 业界 最 经 典 的 计算 机 网 络 教 材 之 一 。 

本 书 第 6 版 继续 保持 了 以 前 版 本 的 特色 ， 为 计算 机 网 络 教 学 提供 了 一 种 新 颖 和 与 时 候 进 的 方法 ， 同 
时 也 进行 了 相当 多 的 修订 和 更 新 : 第 1 章 更 多 地 关注 时 下 ， 更 新 了 接 人 网 的 论述 ; 第 2 SAY Python 蔡 
ET Java 来 介绍 套 接 字 编 程 ; 第 3 章 补 充 了 用 于 优化 云 服务 性 能 的 TCP PARR, 第 4 章 有 关 路 由 
器 体系 结构 的 内 容 做 了 大 量 更 新 ; 第 5 章 重 新 组 织 并 新 增 了 数据 中 心 网 络 的 内 容 ; 第 6 章 更 新 了 无 线 网 
络 的 内 容 以 反映 其 最 新 进展 ; 第 7 章 进 行 了 较 大 修订 ,深入 讨论 了 流 式 视频 ， 包 括 了 适应 性 流 和 CDN 
的 讨论 ; 第 8 章 进 一 步 讨 论 了 端点 鉴别 ;等 等 。 另外， 书后 习题 也 做 了 大 量 更 新 。 

本 书 适合 作为 本 科 生 或 研究 生 “ 计 算 机 网 络 ” 课 程 的 教材 ， 同 时 也 适合 网 络 技 术 人 员 、 专 业 研 究 人 
RE. 
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出 版 者 的 话 


Computer Networking: A Top-Down Approach, Sixth Edition 


文艺 复兴 以 降 ， 源 远 流 长 的 科学 精神 和 逐步 形成 的 学 术 规 范 ， 使 西方 国家 在 目 然 科 学 
的 各 个 领域 取得 了 垄断 性 的 优势 ; 也 正 是 这 样 的 传统 ， 使 美国 在 信息 技术 发 展 的 六 十 多 年 
间 名 家 碍 出 、 独 领 风骚 。 在 商业 化 的 进程 中 ， 美 国 的 产业 界 与 教育 界 越 来 越 紧密 地 结合 ， 
计算 机 学 科 中 的 许多 泰山 北斗 同时 身 处 科研 和 教学 的 最 前 线 ， 由 此 而 产生 的 经 典 科 学 赦 
E, 不仅 壁 划 了 研究 的 范畴 ， 还 揭示 了 学 术 的 源 变 ， 既 遵循 学 术 规 范 ， 又 自 有 学 者 个 性 ， 
其 价值 并 不 会 因 年 月 的 流逝 而 减退 。 

近年 ， 在 全 球 信息 化 大 潮 的 推动 下 ， 我国 的 计算 机 产业 发 展 迅猛 ， 对 专业 人 才 的 需求 
日 益 迫 切 。 这 对 计算 机 教育 界 和 出 版 界 都 既是 机 遇 ， 也 是 挑战 ; 而 专业 教材 的 建设 在 教育 
战略 上 显得 举足轻重 。 在 我 国信 息 技 术 发 展 时 间 较 短 的 现状 下 ， 美国 等 发 达 国 家 在 其 计算 
机 科学 发 展 的 几 十 年 间 积 演 和 发 展 的 经 典 教 材 仍 有 许多 值得 仿 鉴 之 处 。 因 此 ， 引 进 一 批 国 
外 优秀 计算 机 教材 将 对 我 国 计 算 机 教育 事业 的 发 展 起 到 积极 的 推动 作用 ， 也 是 与 世界 接 
轨 、 建 设 真正 的 世界 一 流 大 学 的 必由之路 。 

机 械 工 业 出 版 社 华章 公司 较 早 意识 到 “出 版 要 为 教育 服务 "。 目 1998 年 开始 ， 我 们 就 
将 工作 重点 放 在 了 六 选 、 移 译 国外 优秀 教材 上 。 经 过 多 年 的 不 懈 努 力 ， 我们 与 Pearson, 
McGraw-Hill, Elsevier, MIT, John Wiley & Sons, Cengage 等 世界 著名 出 版 公司 建立 了 良好 
的 合作 关系 ， 从 他 们 现 有 的 数 百 种 教材 中 甄选 出 Andrew S. Tanenbaum, Bjarne Stroustrup, 
Brain W. Kernighan, Dennis Ritchie, Jim Gray, Afred V. Aho, John E. Hopcroft, Jeffrey 
D. Ullman, Abraham Silberschatz, William Stallings, Donald E. Knuth, John L. Hennessy, 
Larry L. Peterson 等 大 师 名 家 的 一 批 经 典 作 品 ， 以 “计算 机 科学 丛书 ”为 总 称 出 版 ， 供 读者 
学 习 、 研 究 及 了 珍藏。 大理石 纹 理 的 封面 ， 也 正体 现 了 这 套 丛 书 的 品位 和 格调 。 

“计算 机 科学 丛书” 的 出 版 工作 得 到 了 国内 外 学 者 的 晶 力 襄 助 ， 国 内 的 专家 不 仅 提供 了 
中 肯 的 选 题 指导 ， 还 不 辞 劳苦 地 担任 了 翻译 和 审 校 的 工作 ， 而 原 书 的 作者 也 相当 关注 其 作品 
在 中 国 的 传播 ， 有 的 还 专程 为 其 书 的 中 译本 作 序 。 迄 今 , “计算 机 科学 丛书” 已 经 出 版 了 近 
两 百 个 品种 ， 这 些 书籍 在 读者 中 树立 了 良好 的 口碑 ， 并 被 许多 高 校 采 用 为 正式 教材 和 参考 书 
籍 。 其 影印 版 “经 典 原 版 书库 ”作为 姊妹 篇 也 被 越 来 越 多 实施 双语 教学 的 学 校 所 采用 。 

权威 的 作者 、 经 典 的 教材 、 一 流 的 译 者 、 严 格 的 审 校 、 精 细 的 编辑 ， 这 些 因素 使 我 们 
的 图 书 有 了 质量 的 保证 。 随 着 计算 机 科学 与 技术 专业 学 科 建 设 的 不 断 完善 和 教材 改革 的 逐 
渐 深 化 ， 教 育 界 对 国外 计算 机 教材 的 需求 和 应 用 都 将 步 人 一 个 新 的 阶段 ， 我 们 的 目标 是 尽 
善 尽 美 ， 而 反馈 的 意见 正 是 我 们 达到 这 一 终极 目标 的 重要 帮助 。 华 章 公 司 欢迎 老师 和 读者 
对 我 们 的 工作 提出 建议 或 给 予 指正 ， 我 们 的 联系 方法 如 下 : 

华章 网 站 : www. hzbook. com 

电子 邮件 : hzjsj@ hzbook. com 

联系 电话 : (010) 88379604 cant 

联系 地 址 :北京 市 西城 区 百 万 庄 南 街 1 号 PR eee 

邮政 编码 : 100037 
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任 ， 国 家 级 实验 教学 示范 中 心 主 任 ; 分 别 于 1982 年 、1988 年 在 解放 
军 信息 工程 学 院 获得 学 士 、 硕 士 学 位 ， 于 1991 年 在 解放 军 通信 工程 学 

院 获 得 博士 学 位 ，1999 ~ 2000 年 为 美国 哥伦比亚 大 学 访问 科学 家 ， 任 

中 国 计 算 机 学 会 网 络 与 数据 通信 专 委 会 副 主任 ， 是 中 国 通 信和 学 会 等 多 

个 学 术 团 体委 员 和 IEEE 会 员 ; 长 期 从 事 网 络 测量 、 分 布 式 系统 、 网 络 

体系 结构 、 网 络 管理 等 领域 斌 究 和 教学 工作 ; 承担 了 国家 目 然 科学 基 

金 、 国 家 863 、 国 家 973 子 课 题 等 项 目 ; 开发 的 多 个 网 络 管理 系统 和 应 用 系统 得 到 广泛 应 

Al; 撰写 网 络 著作 近 10 本 ， 发 表 SCLEI 论文 几 十 篇 ， 有 国家 发 明 专 利 8 项 ; 获得 国家 教 

学 成 末 二 等 奖 1 项 、 省 部 级 科技 进步 二 、 三 等 奖 十 几 项 。 
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近年 来 我 与 Keith W. Ross 教授 在 中 国 的 两 次 会 议 上 见 过 面 。 在 第 一 次 见面 前 ，Ross 教 
授 就 已 经 知 估 我 翻 至 了 他 们 的 教材 的 多 个 版 本 ， 并 在 每 次 翻 详 过 程 中 都 会 通过 电子 邮件 回 
他 们 建言 献策 ， 指 出 技术 瑕 疫 及 排版 错误 。Ross 教授 对 我 的 翻译 工作 表示 了 由 衷 的 感谢 ， 
并 称赞 中 国 高 校 的 计算 机 网 络 教 学 水 平 高 ， 为 世界 培养 了 很 多 优秀 的 网 络 学 生 。 同样 ， 作 
为 译 者 ， 在 每 次 翻译 过 程 中 ， 我 都 会 更 加 深切 地 从 这 本 教科 书 的 字里行间 感受 到 这 两 位 作 
者 作为 网 络 科学 家 和 网 络 教育 家 对 网 络 科 学 技术 的 领悟 力 和 严谨 和 学风。 就 我 的 认识 而 言 ， 
这 本 教科 书 应 当 是 世界 上 最 流行 、 最 好 的 网 络 教科 书 ! 

Kurose 和 Ross 两 位 教授 的 这 本 计算 机 网 络 教 科 书 的 显著 特点 是 : 

1) 极 负 盛名 的 “ 自 顶 同 下 ”网 络 教 学 法 。 由 于 计算 机 网 络 的 复杂 性 ， 长 期 以 来 按 分 
层 体系 结构 自 下 而 上 讲授 网 络 课程 内 容 是 一 种 定式 。 本 书 特别 强调 应 用 层 ， 及 早 激 发 学 生 
们 的 学 习 热 情 ， 及 早 强调 动手 开发 网 络 应 用 程序 。 

2) 着 眼 原 理 。 当 前 计算 机 网 络 领 域 的 许多 基础 性 的 重要 问题 和 基本 原理 已 经 研究 得 
较为 清楚 了 ， 重 点 把 握 这 些 原理 ， 将 使 学 生 获 得 长 “保质 期 ”的 知识 ,在 飞速 发 展 的 网 络 
研究 开发 中 保持 判断 力 和 启发 创造 力 。 

3) 以 因特网 为 研究 对 象 。 该 书 以 因特网 体系 结构 的 5 层 模 型 来 组 织 学 习 过 程 ， 学 以 
致 用 ， 为 学 生 们 的 学 习 热 情 提 供 原 动力 。 

4) 注重 教学 法 。 例 如 : 

。 精心 编排 教学 内 容 。 面 向 重要 的 网 络 知识 点 组 织 教学 内 容 ， 与 时 俱 进 地 补充 了 新 

知识 、 淘 汰 了 旧 内 容 。 

e 强化 能 力 训 练 。 每 章 内 容 后 面 都 配置 了 Wireshark 实验 ， 部 分 章节 后 面 还 配置 了 课 

程 设 计 内 容 。 

o 优质 的 课 后 资料 。 在 保证 大 多 数学 生 向 握 网 络 核 心 知识 点 的 同时 ， 在 课 后 习题 和 

问题 中 为 优秀 学 生 提供 了 思考 空间 。 

e 教学 手段 多 样 化 。 包 括 了 许多 类 比 、 幽 默 和 实际 的 例子 ， 引 人 入 胜 的 历史 事件 和 

实践 原则 ， 对 网 络 领 域 声 名 日 著 的 创新 家 们 的 和 专访， 以 及 网 站 上 翔实 的 教学 资料 
和 实验 内 容 。 

5) 及 时 更 新 教学 内 容 。 本 教科 书 及 时 引入 重要 的 最 新 知识 并 舍弃 了 过 时 的 内 容 。 例 
如 ， 第 1 章 更 新 了 接 人 网 的 论述 ， 增 加 了 因特网 ISP 生态 系统 的 描述 ， 更 新 了 分 组 交换 和 
电路 交换 的 表述 。 第 2 AJH Python 替代 了 Java， 和 希望 更 容易 为 编程 新 手 所 理解 .第 3 ere 
现 了 一 个 简化 的 可 靠 数据 传输 协议 ,增加 了 用 于 优化 云 服务 的 TCP 分 岔 内容. 第 4 章 更 新 
了 路 由 需 体 系 结构 的 章节 。 重 新 组 织 并 简化 了 第 $ 章 内 容 ， 以 反映 近年 来 局 域 网 技术 的 发 
展 变化 。 第 6 草 反 映 了 无 线 网 络 中 的 最 近 进 展 ， 如 蜂 帘 数 据 网 络 和 4G 体系 结构 。 较 多 地 
更 新 了 第 7 MAR, RATE Sitch iA CDN 等 技术 。 

本 书 已 经 成 为 世界 著名 大 学 采用 最 为 广泛 的 网 络 教科 书 ， 本 书 的 中 译本 能 为 缓解 在 有 
限时 间 内 学 习 更 多 的 计算 机 网 络 知识 (而 不 是 英文 1) 这 一 矛盾 起 到 重要 作用 。 由 于 本 书 
的 篇 幅 较 大 ， 我 们 对 使 用 本 书 进 行 教学 的 一 个 建议 是 : 前 6 章 内 容 可 作为 本 科 “ 计 算 机 网 
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络 原理 ”课程 的 教材 ， 而 后 3 章 内 容 可 作为 硕士 研究 生 “ 高 级 计算 机 网 络 ” 课程 或 其 他 相 
关 课 程 的 教学 内 容 。 

在 本 书 的 翻译 过 程 中 ， 译 者 得 到 了 解放 军 理工 大 学 指挥 信息 系统 学 院 、 全 和 军 网 络 技术 
研究 中 心 、 军 用 网 络 技术 实验 室 的 领导 和 同志 们 的 支持 和 帮助 。 本 书 的 责任 编辑 刘 立 卿 女 
士 出 色 的 专业 技能 和 耐心 细致 也 使 本 书 增色 。 

限于 时 间 和 学 识 ， 译 文 错漏 难免 ， 请 识 者 不 音 赐 教 。 请 将 问题 发 送 给 mingchennj@ 
163. com ， 我 将 及 时 反馈 给 读者 。 


陈 鸣 
解放 军 理工 大 学 ， 南 京 
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Computer Networking: A Top-Down Approach, Sixth Edition 


欢迎 阅读 《计算 机 网 络 : 自 项 向 下 方法 》 的 第 6 版 。 目 从 本 书 的 第 1 版 于 12 年 前 出 
WAX, 我们 这 本 书 已 经 被 几 白 了 所 大 学 和 学院 采 用 ， 被 译 为 14 种 语言 ， 并 被 世界 上 几 十 
万 的 学 生 和 从 业 人 员 使 用 。 我 们 倾听 了 许多 读者 的 意见 ， 赞 扬 之 声 不 绝 于 耳 。 


第 6 版 的 新 络 之 处 


我 们 认为 本 书 成 功 的 一 个 重要 原因 是 ， 持 续 地 为 计算 机 网 络 教学 提供 了 一 种 新 络 和 与 
时 俱 进 的 方法 。 在 第 6 版 中 我 们 做 了 改变 ,但 也 保持 了 我 们 认为 (并 且 得 到 了 使 用 本 书 的 
教师 和 学 生 的 认可 ) 本 书 最 为 重要 的 方面 : 它 的 自 顶 回 下 的 方法 ， 它 关注 因特网 和 计算 机 
网 络 的 现代 处 理 方法 ， 它 的 注重 原则 和 实践 ， 以 及 它 易 于 理解 的 风格 和 学 习 计算 机 网 络 的 
方法 。 无 论 如 何 ， 第 6 版 中 已 经 进行 了 相当 多 的 修订 和 更 新 : 


配套 Web whit STRAWS He, HEHEA S VideoNotes 和 交互 式 练 习 ， 后 面 将 
讨论 它们 。 

在 第 1 AP, 已 经 更 新 了 接 入 网 的 论述 ， 并 且 因 为 近期 出 现 的 内 容 提 供 商 网 络 
(如 谷歌 公司 的 网 络 ) ， 对 因特网 ISP 生态 系统 的 描述 进行 了 相当 多 的 改进 。 重 新 
组 织 了 分 组 交换 和 电路 交换 的 表述 ， 以 更 多 地 关注 时 下 而 不 是 历史 。 

在 第 2 P, JH Python 替代 了 Java 来 介绍 套 接 字 编程 。Python 代码 仍 能 明确 地 揭 
示 套 接 字 API 背后 的 关键 思想 ， 同 时 也 更 容易 为 编程 新 手 所 理解 。 此 外 ， 与 Java 
不 同 ，Python 提供 了 对 原始 套 接 字 的 访问 ， 使 学 生 们 能 够 构建 各 种 各 样 的 网 络 应 
用 。 基 于 Java 的 套 接 字 编程 实验 已 经 由 对 应 的 Python 实验 所 代替 ， 并 且 增 加 了 新 
的 基于 Python 的 ICMP ping 实验 。 与 往常 一 样 ， 当 材料 不 再 在 书 中 使 用 后 ， 如 基 
于 Java 的 套 接 字 编程 材料 ， 在 本 书 的 配套 网 站 上 仍 将 继续 可 用 〈 参 见 下 文 说 明 ) 。 
在 第 3 章 中 ， 简 化 了 一 个 可 靠 数 据 传 输 协 议 的 表述 ， 增 加 了 一 个 有 关 TCP 分 贫 的 
新 “插入 材料 ”(sidebar) “，TCP 分 贫 通 常用 于 优化 云 服 务 的 性 能 。 

在 第 4 章 中 ， 有 关 路 由 需 体 系 结构 的 小 节 进 行 了 很 大 更 新 ， 反 映 了 该 领域 中 的 最 
新 发 展 和 实践 。 包 括 了 几 个 涉及 DNS, BGP 和 OSPF 的 新 的 综合 “插入 材料 ”。 
第 5 章 进 行 了 重新 组 织 ， 使 之 更 加 合理 ， 这 是 因为 在 局 域 网 中 交换 以 太 网 的 普 i 
人 存在， 以 及 随 之 而 来 点 到 点 场景 中 以 太 网 使 用 的 增加 。 此 外 ， 增 加 了 有 关 数 据 中 
心 网 络 的 新 的 小 节 。 

更 新 了 第 6 章 以 反映 无 线 网 络 中 的 最 新 进展 ， 特 别 是 蜂窝 数据 网 和 4G 服务 及 体系 
结构 。 

第 7 草 关 注 多 媒体 网 络 ， 该 章 进 行 了 较 大 的 修订 。 这 一 章 现在 包括 了 流 式 视频 的 
深入 讨论 ， 包 括 了 适应 性 流 以 及 有 关 CDN 的 全 新 的 和 现代 的 讨论 。 新 增加 的 一 节 
描述 了 Netflix, YouTube 和 “看 看 ”视频 流 系 统 。 为 给 这 些 新 主题 让 路 而 被 删除 


这 种 插入 的 补充 资料 多 以 文本 框 形式 插 在 相应 正文 语 境 中 .一 一 编辑 注 


Vill 


的 材料 仍 在 配套 网 站 上 可 供 使 用 。 

e 第 8 彰 现 在 包括 有 关 端 点 鉴别 的 扩展 讨论 ， 

e 已 经 增加 了 涉及 每 草 后 面 习 题 的 可 观 新 材料 。 与 前 面 所 有 各 版 一 样 ， 对 珠 后 习题 
进行 修订 、 增 加 和 删除 。 


本 书 对 象 


本 书 适用 于 计算 机 网 络 的 第 一 门 课程 ， 既 可 用 于 计算 机 科学 系 的 学 生 ， 也 可 用 于 电子 
工程 系 的 学 生 。 就 编程 语言 而 言 ， 本 书 仅 假定 学 生 们 具有 C, C++, Java 或 Python 的 编程 
经 验 (也 只 是 在 几 个 地 方 用 到 ) 。 与 许多 入门 性 的 其 他 计算 机 网 络 教科 书 相 比 ， 尽 管 本 书 
表述 更 为 精确 ， 分 析 更 为 细致 ， 然 而 书 中 很 少 用 到 高 中 阶段 没有 教 过 的 数学 概念 。 我 们 有 
意 避 免 使 用 任何 高 等 微 积分 、 概 率 论 或 随机 过 程 的 概念 〈 尽 管 我 们 为 具有 这 种 高 级 背景 的 
学 生 们 准备 了 某 些 课 后 习题 ) 。 因 此 ， 本 书 适用 于 本 科 生 课程 和 一 年 级 研究 生 课 程 。 它 对 
于 电信 业 的 从 业 人 员 也 应 当 有 用 。 


本 书 的 独特 之 处 


计算 机 网 络 这 门 课 程 极为 复杂 ， 小 及 许多 以 错综复杂 的 方式 彼此 交织 的 概念 、 协 议和 
技术 。 为 了 处 理 这 种 大 跨度 和 高 复杂 性 ， 许 多 计算 机 网 络 教科 书 都 围绕 计算 机 网 络 体系 结 
构 的 “层次 ”来 组 织 内 容 。 借 助 于 这 种 分 层 的 组 织 结构 ， 学 生 们 能 够 透 过 计算 机 网 络 的 复 
杂 性 看 到 其 内 部 ， 他 们 在 学 习 整个 体系 结构 的 某 个 部 分 中 的 独特 概念 和 协议 的 同时 ， 也 能 
看 清 所 有 这 些 部 分 是 如 何 整 合 在 一 起 的 全 貌 。 从 教学 法 的 角度 来 看 ， 我 们 的 个 人 体验 是 这 
种 分 层 的 教学 方法 的 确 是 非常 必要 的 。 然 而 ,我们 发 现 那 种 自 底 向 上 的 传统 教学 方法 ， 即 
从 物理 层 到 应 用 层 逐 层 进行 讲解 的 方法 ， 对 于 现代 计算 机 网 络 课程 并 非 是 最 佳 的 方法 . 
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本 书 于 12 年 前 首次 以 自 项 向 下 的 方式 来 对 每 网 络 ， 这 就 是 说 从 应 用 层 开始 向 下 一 直 
讲 到 物理 层 。 我 们 从 老师 以 及 学 生 那 里 得 到 的 反馈 证 实 了 这 种 目 顶 回 下 方法 有 许多 好 处 ， 
并 且 从 教学 法 来 讲 的 确 很 好 实施 。 首 先 ， 它 特别 强调 应 用 层 CE EP PA) fe FES Sil 
W). 的 确 ， 计 算 机 网 络 中 的 许多 近期 革命 ， 都 发 生 在 应 用 层 ， 其 中 包括 Web 、 对 等 文件 
共享 和 媒体 流 。 及 早 强调 应 用 层 的 方法 不 同 于 大 多 数 其 他 教科 书 中 所 采取 的 方法 ， 那 些 教 
科 书 中 只 有 少量 有 关 网 络 应 用 、 它 们 的 需求 、 应 用 层 范式 〈 例 如 客户 -服务 入 和 对 等 方 到 
对 等 方 ) 以 及 应 用 编程 接口 方面 的 内 容 。 第 二 ， 我们 (和 使 用 本 书 的 许多 教师 ) 作为 教 
师 的 经 验 是 ， 在 课程 开始 后 就 教授 网 络 应 用 的 内 容 ， 是 有 效 激励 学 习 积 极 性 的 工具 。 学 生 
们 急于 知道 诸如 电子 邮件 和 Web 等 网 络 应 用 是 如 何 工作 的 ， 这 些 都 是 多 数学 生 每 天 部 在 
使 用 的 应 用 。 一 旦 理解 了 这 些 应 用 ， 学 生 们 便 能 够 理解 文 持 这 些 应 用 的 网 络 服务 ， 接 下 来 
则 会 仔细 思考 在 较 低 层次 中 可 能 提供 和 实现 这 些 服 务 的 各 种 方式 。 因此， 及 是 地 涉及 应 用 
程序 能 够 激发 学 生 们 学 习 本 书 其 余部 分 的 积极 性 。 

第 三 ， 目 顶 向 下 方法 使 得 教师 能 够 在 教学 的 早期 阶段 介绍 网 络 应 用 程序 的 开发 . 学 生 
们 不 仪 能 够 明白 流行 的 应 用 程序 和 协议 的 工作 原理 ， 还 能 学 习 到 创造 自己 的 网 络 应 用 程 厅 
和 应 用 级 协议 是 多 么 容易 。 采 用 自 项 回 下 的 方法 后 ,学生 们 能 够 及 早 地 搞 清 套 接 字 编 程 、 


服务 模型 和 协议 的 概念 ， 这 些 重 要 概念 为 后 续 讨 论 的 各 层 做 了 铺垫 。 通 过 提供 用 Python 语 
言 写 成 的 套 接 字 编 程 的 例子 ， 我 们 强调 主要 思想 ， 而 不 会 使 学 生 们 陷于 复杂 代码 的 困境 。 
电气 工程 和 计算 机 科学 系 的 本 科 生 理解 这 些 代码 应 当 不 会 有 困难 。 


以 因特网 为 研究 目标 


PRA AS 4 版 起 我 们 从 书 名 中 去 掉 卫 “Featuring the Internet” (描述 因特网 特色 ) 这 
个 短语 ， 但 这 并 不 意味 着 我 们 不 再 关注 因特网 ! 的 确 ， 一 切 如 初 ! 而 且 因 为 因特网 已 经 变 
得 无 所 不 在 ， 我 们 反而 认为 任何 网 络 教 科 书 都 必须 非常 关注 因特网 ， 因 此 该 短语 在 某 种 程 
度 上 已 经 没有 必要 了 。. 我们 继续 使 用 因特网 的 体系 结构 和 协议 为 基本 载体 来 学 习 基 本 的 计 
算 机 网 络 概 念 。 当 然 ， 我们 也 能 把 概念 和 协议 放 入 其 他 网 络 体系 结构 中 讲解 。 但 是 我 们 的 
关注 焦点 是 因特网 ， 这 反映 在 我 们 围绕 因特网 体系 结构 的 5 层 模型 来 组 织 材料 ， 这 5 个 层 
次 是 应 用 层 、 运 输 层 、 网 络 层 、 链 路 层 和 物理 层 。 

聚焦 因特网 的 男 一 个 好 处 是 ， 大 多 数 计算 机 科学 和 电气 工程 的 学 生 急 切 地 希望 学 习 因 
特 网 及 其 协议 。 他 们 知道 因特网 是 一 种 章 命 性 和 破坏 性 的 技术 ， 正 在 深刻 地 改变 着 我 们 的 
世界 。 有 了 对 因特网 大 量 中 肯 的 认识 后 ， 学 生 们 自然 而 然 会 对 学 习 其 内 部 原理 有 了 求知 
和 欲 。 因 此 ， 一 旦 用 因特网 作为 定 回 焦点 ， 教 师 就 易于 调动 学 生 们 学 习 基 本 原理 的 积极 
性 了 ， 


教授 网 络 原理 


本 书 的 两 个 独特 之 处 是 自 项 回 下 方法 和 关注 因特网 ， 这 已 经 显现 在 本 书 的 书 名 中 。 如 
果 我 们 能 够 在 副 书 名 中 加 进 第 三 个 词 的 话 ， 原 理 一 词 将 包括 在 其 中 。 网 络 领 域 已 经 发 展 得 
相当 成 熟 ， 许 多 基础 性 的 重要 问题 能 够 认识 清楚 。 例 如 ， 在 运输 层 ， 基 础 性 问题 包括 建立 
在 不 可 靠 的 网 络 层 上 的 可 靠 通 信 、 连 接 建立 /拆除 与 握手 、 拥 塞 和 流量 控制 以 及 多 路 复 用 . 
两 个 非常 重要 的 网 络 层 问题 是 ， 在 两 台 路 由 帮 之 间 找 到 “好 的 ”路 人 笃 和 互联 大 量 的 异 构 网 
络 。 在 数据 链 路 层 ， 基 础 性 问题 是 共享 多 路 访问 信道 。 在 网 络 安全 中 ， 提 供 机 密 性 、 鉴 别 
和 报 文 完 整 性 的 技术 都 基于 密码 学 基本 理论 。 本 书 在 指明 基础 性 网 络 问题 的 同时 ， 也 会 介 
绍 解决 这 些 问题 的 方法 。 学 习 这 些 原理 的 学 生 将 获得 具有 长 “保质 期 ”的 知识 ， 在 今天 的 
网 络 标准 和 协议 已 经 变 得 过 时 很 长 时 间 后 ， 其 中 的 原理 将 仍然 重要 和 中 肯 。 我 们 相信 ， 用 
因特网 将 学 生 引 入 网 络 之 门 后 ， 再 强调 基础 性 问题 及 其 解决 方案 ， 这 种 两 者 结合 的 方法 将 
使 他 们 迅速 理解 几乎 任何 网 络 技术 ， 
Web 站 点 
本 书 配套 的 Web 站 点 位 于 http://wps. pearsoned. com/ecs_kurose_compnetw _6 9 该 站 
点 包括 : 
© 交互 式 学 习 材 料 。 本 书 第 6 版 的 一 个 重要 的 新 组 成 部 分 是 大 大 地 扩充 了 在 线 和 交 
互 学 习 的 材料 。 本 书 的 配套 网 站 现在 包括 视频 要 点 (VideoNotes)， 即 由 作者 制作 
的 全 书 重要 主题 的 视频 呈现 ， 以 及 对 习题 解答 的 简要 讲解 ， 这 些 习 题 类 似 于 每 章 


O ”此 为 日 前 有 效 的 网 址 ， 如 果 出 现 不 可 访问 的 情形 ， 请 联系 Service. cn@ Pearson. com 。 一 -一 编辑 注 


后 面 的 习题 。 我 们 也 增加 了 交互 式 练 习 ， 该 练习 能 够 生成 与 每 章 后 面 所 选 刁 题 类 
似 的 问题 ( 并 呈现 答案 )。 因 为 学 生 们 能 够 产生 无 数 类 似 问 题 的 实例 (并 看 到 解 
答 ) ， 他 们 能 够 练习 到 真正 掌握 这 些 材料 为 止 。 我 们 已 经 在 Web 站 点 上 提供 了 第 
1 ~5 草 的 视频 要 点 和 在 线 习 题 ， 并 且 将 随时 间 推 移 而 继续 积极 地 增加 和 更 新 这 些 
材料 。 如 在 前 面 版 本 中 一 样 ， 该 Web 站 点 包含 了 交互 式 Java 小 程序 ， 以 动 男方 式 
显示 了 重要 的 网 络 概念 。 该 站 点 也 具有 交互 式 小 测验 ， 人 允许 学 生 们 检查 他 们 对 该 
专题 内 容 的 基本 理解 。 教 授 们 能 够 将 这 些 交 互 式 特色 综合 进 他 们 的 讲义 中 或 将 它 
们 用 作 小 实验 。 

e 附加 的 技术 材料 。 由 于 我 们 在 本 书 的 每 个 版 本 中 都 增加 了 新 材料 ， 故 我 们 不 得 不 
删 去 某 些 现 有 主题 以 保持 篇 幅 的 合理 。 例 如 ， 为 了 在 本 版 中 为 新 材料 腾 出 空间 ， 
我 们 删除 了 有 关 ATM 网 络 和 用 于 多 媒体 的 RTSP 协议 。 出 现在 本 书 较 早 版 本 上 的 
材料 仍然 是 有 趣 的 ， 并 且 能 够 在 本 书 Web 网 站 上 找到 。 

® 编程 作业 。Web 网 站 也 提供 了 一 些 详细 的 编程 作业 。 这 些 编程 作业 包括 了 构建 一 
台 多 线程 Web 服务 器 ， 构 建 一 个 具有 GUI 接口 的 电子 邮件 客户 ， 发 送 端 和 接收 端 
可 靠 数据 传输 协议 的 编程 ， 分 布 式 路 由 选择 算法 的 编程 ， 等 等 。 

e Wireshark 实验 。 通 过 观察 网 络 协议 的 动作 ， 读 者 能 够 大 大 加 次 对 它们 的 理解 。 该 
Web 站 点 提供 了 一 些 Wireshark 作业 ， 使 学 生 们 能 够 实际 观察 两 个 协议 实体 之 间 报 
文 的 交换 顺序 。 该 Web 站 点 包括 了 有 关 HTTP, DNS, TCP, UDP, IP, ICMP, LI 
太 网 、ARP、WiFi 和 SSL 的 单独 Wireshark 实验 ， 以 及 跟踪 在 获取 一 个 Web 网 页 
的 请 求 时 所 涉及 的 所 有 协议 的 Wireshark 实验 。 


教学 特色 


我 们 每 位 作者 都 教 了 20 多 年 的 计算 机 网 络 课 程 ， 这 本 书 凝 聚 了 我 们 总 共 50 多 年 教 了 
几 千 名 学 生 的 教学 经 验 。 在 此 期 间 ， 我 们 也 成 为 计算 机 网 络 领 域 活跃 的 研究 人 员 。 (事实 
E, James 和 Keith 于 1979 年 在 哥伦比亚 大 学 彼此 相识 ， 共 同 选 了 由 Mischa Schwartz 执教 
的 硕士 研究 生计 算 机 网 络 课程 。) 我 们 认为 所 有 这 些 都 给 了 我 们 对 于 网 络 现状 和 网 络 未 来 
的 可 能 发 展 方向 的 恨 好 观察 力 。 无 论 如 何 ， 我 们 在 组 织 这 本 书 的 材料 时 ， 抵 御 住 了 人 筷 向 目 
己 所 钟爱 的 研究 项 目的 诱惑 。 如 果 你 对 我 们 的 研究 工作 感 兴趣 的 话 ， 可 以 访问 我 们 的 个 人 
Web 网 站 。 因 此 ， 这 是 一 本 关于 现代 计算 机 网 络 的 书 ， 即 该 书包 含 了 当代 协议 和 技术 以 及 
支撑 这 些 协 议和 技术 的 基本 原理 。 我 们 也 认为 学 习 (和 讲授 ) 网 络 是 令 人 开心 的 事 。 本 书 
中 包括 的 幽默 、 使 用 的 类 比 和 现实 世界 的 例子 将 有 望 使 这 些 材 料 更 具 趣 味 性 。 


教师 们 的 补充 材料 


我 们 提供 了 一 套 完 整 的 补充 材料 ， 以 帮助 教师 们 教授 这 门 课程 。 这 些 材料 都 能 通过 访 
问 Pearson 的 教师 资源 中 心 (http://www. pearsonhighered. com/ irc 9) 得 到 。 有 关 获 取 访 问 
这 些 教师 补充 材料 的 信息 可 访问 教师 资源 中 心 或 向 computing@ aw. com RX FABLE. 


名 ”该 地 址 为 英文 版 教材 的 服务 地 址 ， 中 文 版 教师 想 获取 相关 教 辅 资 料 ， 请 联系 Service. CN@ Pearson. com 和 
编辑 注 





www. pearsonhigher ed. com/ educator, 
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© PowerPoint 幻灯 片 。 我 们 提供 了 全 部 9 BL AY PowerPoint 幻灯 片 。 幻 灯 片 根据 第 6 
版 进行 了 完整 的 更 新 。 这 些 幻灯 片 详细 地 涵盖 了 每 章 的 内 容 。 幻 灯 片 中 使 用 了 
图 片 和 动画 (而 非 仅 是 单调 的 文本 标题 )， 这 使 得 这 些 幻灯 片 有 趣 旦 在 视觉 上 有 
吸引 力 。 我 们 向 教师 提供 了 原始 的 幻灯 片 ， 使 得 教师 能 够 做 个 性 化 修改 以 满足 
日 己 的 教学 需要 。 这 些 幻灯 片 中 的 某 些 部 分 就 是 由 采用 本 书 进行 教学 的 教师 所 
页 献 的 。 

© 课 后 习题 解答 。 我 们 提供 了 本 书 中 课 后 习题 的 解 题 手 册 、 编 程 作业 和 Wireshark 实 
验 。 如 前 所 述 ， 我 们 在 本 书 的 前 5 草 中 引入 了 许多 新 的 课 后 作业 。 


各 章 间 的 关联 性 


本 书 的 第 1 草 提供 了 对 计算 机 网 络 自 包 含 的 概述 。 该 章 介 绍 了 许多 重要 的 概念 与 术 
语 ， 为 本 书 的 其 余部 分 葛 定 了 基础 。 其 他 所 有 章 都 直接 依赖 于 第 1 章 的 内 容 。 在 讲解 完 第 
1 前 之 后 ， 我 们 推荐 按 顺 序 讲解 第 2 ~5 章 的 内 容 ， 这 样 就 遵循 了 自 顶 向 下 的 理念 。 这 5 章 
中 任何 一 章 都 会 用 到 前 面 各 草 的 内 容 。 在 完成 前 5 章 的 教学 后 ， 教 师 就 有 了 相当 大 的 灵活 
性 。 最 后 4 草 之 间 没 有 任何 相关 性 ， 因 此 能 够 以 任何 顺序 进行 教学 。 然 而 ， 最 后 4 章 中 的 
每 一 曹 者 依赖 于 前 5 草 中 的 材料 。 许 多 教师 采用 的 教学 方案 是 : 教授 前 5 章 ， 然 后 讲授 后 
4 草 之 一 作为 点 睛 之 笔 。 


最 后 的 话 : 我 们 乐于 听取 你 的 意见 


我 们 或 励 学 生 和 教师 回 我 们 发 送 电子 邮件 ， 发 表 对 本 书 的 任何 评论 。 对 我 们 而 言 ， 
能 够 听 到 来 自 全 世界 的 教师 和 学 生 就 本 书 前 5 版 的 反馈 ， 是 令 人 愉快 的 事 。 我 们 已 经 在 
本 书 新 版 中 综合 进 这 些 建议 中 的 许多 条 。 我 们 也 鼓励 教师 向 我 们 发 送 新 的 课 后 习题 (及 
其 解答 ) ， 这 将 完善 当前 的 课 后 习题 。 我 们 将 这 些 习 题 放 在 配套 Web 网 站 上 只 有 教师 才 
能 访问 的 部 分 。 我 们 也 鼓励 教师 和 学 生 编 写 新 的 Java 小 程序 来 诠释 书 中 的 概念 和 协议 。 
如 有 果 你 有 了 认为 适合 于 本 书 的 小 程序 ， 请 将 它 发 送 给 作者 。 如 果 该 小 程序 (包括 标记 和 
术语 ) 合适 的 话 ， 我 们 很 乐意 将 它 放 在 本 书 的 网 站 上 ， 并 附 上 该 小 程序 作者 的 适当 

正如 谚语 所 说 :“ 让 那些 卡片 和 信件 到 来 吧 !” 我 们 郑重 宣布 ,请 大 家 一 如 既往 地 告诉 
我 们 有 趣 的 URL， 指 出 排版 错误 ， 不 赞成 我 们 的 哪些 主张 ， 告 诉 我 们 怎样 做 效果 好 ， 怎 样 
做 效果 不 好 。 告 诉 我 们 你 认为 在 本 书 下 一 版 中 应 当 包 括 哪 些 内容 ， 应 当 删 除 哪些 内 容 。 我 
们 的 电子 邮件 地 址 是 kurose@ cs. umass. edu 和 ross@ poly. edu, 
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日 世界 各 地 成 千 上 万 的 读者 们 ， 包 括 学 生 、 教 职员 和 从 业 人 员 ， 他 们 给 了 我 们 对 于 本 书 以 
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Computer Networking; A Top-Down Approach, Sixth Edition 


计算 机 网 络 和 因特网 





今天 的 因特网 无 疑 是 有 史 以 来 由 人 类 创造 、 精 心 设计 的 最 大 系统 ， 该 系统 具有 数 以 亿 
计 的 相连 的 计算 机 、 通 信和 链 路 和 交换 机 ， 有 数 十 亿 的 使 用 便携 计算 机 、 平 板 电 脑 和 智能 手 
机 的 用 户 ， 并 且 还 有 一 批 与 因特网 连接 的 新 型 设备 ， 如 传感器 、Web 摄像 机 、 游 戏 机 、 相 
框 甚至 洗衣 机 。 面 对 如 此 巨大 并 且 具 有 如 此 众多 不 同 组 件 和 用 户 的 因特网 ， 是 否 能 够 理解 
它 的 工作 原理 ? 是否 存 在 某 些 指导 原则 和 结构 ， 能 够 作为 理解 规模 和 复杂 程度 惊人 的 系统 
的 基础 ?如果 是 这 样 的 话 ， 使 学 习 计算 机 网 络 成 为 既 引 人 人 胜 又 趣味 咕 然 的 事 是 可 能 的 
吗 ? 幸运 的 是 ， 对 所 有 这 些 问题 都 是 响亮 的 肯定 答复 。 本 书 的 目的 的 确 是 向 读者 介绍 计算 
机 网 络 这 个 动态 领域 的 最 新 知识 ， 使 他 们 深入 地 理解 网 络 的 原则 和 实践 。 使 读者 不 仅 能 理 
解 今天 的 网 络 ， 而 且 能 理解 明天 的 网 络 。 

第 1 章 概述 了 计算 机 网 络 和 因特网 。 这 一 章 的 目标 是 从 整体 上 粗 线条 地 勾画 出 计算 机 
网 络 的 概貌 ， 并 且 描 述 本 书 内 容 的 框架 。 这 一 章 包括 大 量 的 背景 知识 ， 讨 论 大 量 的 计算 机 
网 络 构件 ， 而 且 将 它们 放 在 整个 网 络 的 大 环境 中 进行 讨论 。 

本 章 将 以 如 下 方式 组 织 计算 机 网 络 的 概述 : 在 介绍 了 某 些 基本 术语 和 概念 后 ， 将 首先 
查看 构成 网 络 的 基本 硬件 和 软件 组 件 。 我 们 从 网 络 的 边缘 开始 ， 考 察 在 网 络 中 运行 的 端 系 
统 和 网 络 应 用 ; 接 下 来 探究 计算 机 网 络 的 核心 ， 查 看 传输 数据 的 链 路 和 交换 机 ， 以 及 将 端 
系统 与 网 络 核心 相连 接 的 接 入 网 和 物理 媒体 。 我 们 将 了 解 因特网 是 “网 络 的 网 络 "， 并 将 
得 知 这 些 网 络 是 怎样 彼此 连接 起 来 的 。 

在 浏览 完 计算 机 网 络 的 边缘 和 核心 之 后 ， 本 章 的 后 半 部 分 将 从 更 广泛 、 更 抽象 的 角度 
来 考察 计算 机 网 络 。 我 们 将 考察 在 计算 机 网 络 中 数据 的 时 延 、 丢 包 和 吞吐 量 ， 给 出 一 个 端 
到 端 吞吐 量 和 时 延 的 简单 定量 模型 : 该 模型 兼顾 了 传输 、 传 播 和 排队 时 延 等 因素 。 接 下 
来 ， 我 们 将 介绍 计算 机 联网 时 的 一 些 关键 的 、 体 系 结构 上 的 原则 ， 如 协议 分 层 和 服务 模 
型 。 我 们 还 将 了 解 到 计算 机 网 络 对 于 许多 不 同类 型 的 攻击 来 说 是 脆弱 的 ， 我 们 将 回顾 其 中 
的 某 些 攻击 并 且 考 虑 使 计算 机 网 络 更 为 安全 的 方法 。 最 后 ， 我 们 将 以 计算 机 网 络 的 简要 历 
史 结 束 本 章 的 学 习 。 


1.1 什么 是 因特网 


在 本 书 中 ， 我 们 使 用 一 种 特定 的 计算 机 网 络 ， 即 公共 因特网 ， 作 为 讨论 计算 机 网 络 及 
其 协议 的 主要 载体 ,但 什么 是 因特网 ”回答 这 个 问题 有 两 种 方式 : 其 一 ,我 们 能 够 描述 因 
特 网 的 具体 构成 ， 即 构成 因特网 的 基本 硬件 和 软件 组 件 ; 其 二 ,我 们 能 够 根据 为 分 布 式 应 
用 提供 服务 的 联网 基础 设施 来 描述 因特网 。 我 们 先 从 描述 因特网 的 具体 构成 开始 ， 并 用 
图 1-1 举例 说 明 我 们 的 讨论 。 


1.1.1 具体 构成 描述 
因特网 是 一 个 世界 范围 的 计算 机 网 络 ， 即 它 是 一 个 互联 了 所 及 全 世界 的 数 以 亿 计 的 计算 
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设备 的 网 络 ”在 不 久 前 ， 这 些 计 算 设 备 多 数 是 传统 的 果 面 PC、Linux 工作 站 以 及 所 谓 的 服务 
ae (它们 用 于 存储 和 传输 Web 页 面 和 电子 邮件 报 文 等 信息 )， 然 而 ， 越 来 越 多 的 非 传 统 的 因 
特 网 端 系统 ( 如 便携 机 、 智 能 手机 、 平 板 电 脑 、 电 视 、 游 戏 机 、Web 相机 、 汽 车 、 环 境 传 感 
设备 、 数 字 相 框 、 家 用 电 需 ) 和 安全 系统 ， 正 在 与 因特网 相连 。 的 确 ， 在 许多 非 传 统 设备 连 
接 到 因特网 的 情况 下 ,计算 机 网 络 这 个 术语 开始 听 起 来 有 些 过 时 了 ， 用 因特网 术语 来 说 ,所 
有 这 些 设 备 都 称 为 主机 (host) 或 端 系统 (end system), 到 2011 年 7 月 为 止 FAY 8.5 {2 
人 台 端 系统 与 因特网 连接 ， 这 并 未 将 智能 手机 、 便 携 机 和 仪 断断续续 与 因特网 连接 的 其 他 设备 
计算 在 内 [ISC 2011]。 总 体 来 说 ， 因 特 网 用 户 数 估计 超过 20 亿 [ITU 2011 | . 
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图 1-1 因特网 的 一 些 部 件 
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ving As eH et A SE 28 (communication link) 和 分 组 交换 机 (packet switch) 连接 到 一 
起 . 在 1.2 节 中 .我 们 将 介绍 许多 类 型 的 通信 链 路 ， 它 们 由 不 同类 型 的 物理 媒体 组 成 。 这 
些 物理 媒体 包括 问 轴 电 绕 、 铜 线 、 光 纤 和 无 线 电 频 谱 。 不 同 的 链 路 能 够 以 不 同 的 速率 传输 
数据 ， 链 路 的 传输 速率 以 比特 / 秒 度 量 (bits， 或 bps). 4— im KSC lhl A — e Im KBE 
发 送 数 据 时 ， 发 送 端 系统 将 数据 分 段 ， 并 为 每 段 加 上 首部 字 节 。 由 此 形成 的 信息 包 用 计算 
机 网 络 的 术语 来 说 称 为 分 组 (packet)。 这 些 分 组 通过 网 络 发 送 到 目的 端 系 统 ， 在 那里 被 
装配 成 初始 数据 。 

分 组 交换 机 从 它 的 一 条 人 通信 和 链 路 接收 到 达 的 分 组 ， 并 从 它 的 一 条 出 通信 和 链 路 转发 该 
分 组 。 市 面 上 流行 着 各 种 类 型 、 各 有 具 特色 的 分 组 交换 机 ， 但 在 当今 的 因特网 中 ， 两 种 最 著 
名 的 类 型 是 路 由 器 (router) 和 链 路 层 交 换 机 (link-layer switch) 。 这 两 种 类 型 的 交换 机 朝 
痢 最 终 目 的 地 转发 分 组 。 链 路 层 交 换 机 通 稼 用 于 接 和 网 中 ， 而 路 由 融通 凋 用 于 网 络 核心 
中 。 从 发 送 端 系统 到 接收 奖 系 统 ， 一 个 分 组 所 经 历 的 一 系列 通信 链 路 和 分 组 交换 机 称 为 通 
过 该 网 络 的 路 径 (route 或 path) 。 因 特 网 所 承载 的 精确 通信 量 是 难以 估算 的 ， 不 过 思科 公 
司 [Cisco VNI 2011] 估计 ， 全 球 因 特 网 流量 在 2012 年 每 月 大 约 为 40EB (10 字 节 ) 。 

用 于 传送 分 组 的 分 组 交换 网 络 在 许多 方面 类 似 于 承载 运输 车 辆 的 运输 网 络 ， 该 网 络 包 
括 了 高 速 公 路 、 公 路 和 立交 桥 。 例 如 ， 考 虑 下 列 情 况 ， 一 个 工厂 需要 将 大 量 货物 搬运 到 数 
千 公 里 以 外 的 某 个 目的 地 仓库 。 在 工厂 中 ， 贷 物 要 分 开 并 装 上 卡车 车 队 。 然 后 ， 每 辆 卡车 
独立 地 通过 高 速 公路 、 公 路 和 立交 桥 组 成 的 网 络 问 该 仓库 运送 货物 。 在 目的 地 仓库 ， 缉 下 
这 些 货物 ， 并 且 与 一 起 装载 的 同一 批 货物 的 其 余部 分 堆放 在 一 起 。 因 此 ， 在 许多 方面 ,分 
组 类 似 于 卡车 ， 通 信和 链 路 类 似 于 高 速 公路 和 公路 ， 分 组 交换 机 类 似 于 立交 桥 ， 而 端 系统 类 
似 于 建筑 物 。 就 像 卡 车 选取 运输 网 络 的 一 条 路 径 前 行 一 样 ， 分 组 则 选取 计算 机 网 络 的 一 条 
路 径 前 行 。 

病 系 统 通 过 因特网 服务 提供 商 (Internet Service Provider, ISP) 接 人 和 人 因特网， 包括 如 
本 地 电缆 或 电话 公司 那样 的 住宅 区 ISP, ZA] ISP, KÆ ISP， 以 及 那些 在 机 场 、 旅 馆 、 咖 
啡 店 和 其 他 公共 场所 提供 WiFi 接 入 的 ISP, EA ISP 是 一 个 由 多 个 分 组 交换 机 和 多 段 通信 
链 路 组 成 的 网 络 。 各 ISP 为 病 系 统 提供 了 各 种 不 同类 型 的 网 络 接 和 人 入， 包括 如 线 绕 调制 解 调 
ara DSL 那样 的 住宅 宪 带 接 和 人 入、 高 速 局 域 网 接 入 、 无 线 接 入 和 56kbps 拨号 调制 解 调 颖 接 
Ao ISP 也 为 内 容 提 供 者 提供 因特网 接 人 服务 ， 将 Web 站 点 直接 接 入 因特网 。 因 特 网 就 是 
将 端 系统 彼此 互联 ， 因 此 为 端 系 统 提供 接 入 的 ISP 也 必须 互联 。 低 层 的 ISP 通过 国家 的 、 
国际 的 高 层 ISP (如 Level 3 Communications, AT&T, Sprint Al NTT) 互联 起 来 。 高 层 ISP 
是 由 通过 高 速 光 纤 链 路 互联 的 高 速 路 由 需 组 成 的 。 无 论 是 高 层 还 是 低层 ISP 网 络 ， 它 们 每 
个 者 是 独立 管理 的 ， 运 行 着 IP 协议 (详情 见 后 )， 遵 从 一 定 的 命名 和 地 址 习惯 。 我 们 将 在 
1.3 市 中 更 为 详细 地 考察 ISP 及 其 互联 的 情况 。 

端 系统 、 分 组 交换 机 和 其 他 因特网 部 件 都 要 运行 一 系列 协议 (protocol)， 这 些 协 议 
控制 因特网 中 信息 的 接收 和 发 送 。TCP (Transmission Control Protocol， 传 输 探 制 协议 ) 
AIP (Internet Protocol， 网 际 协议 ) 是 因特网 中 两 个 最 为 重要 的 协议 。IP 协议 定义 了 在 
路 由 希 和 端 系统 之 间 发 送 和 接收 的 分 组 格式 。 因 特 网 的 主要 协议 统称 为 TCP/ZIP。 我 们 
在 这 一 草 中 就 开始 接触 这 些 协议 。 但 这 仅仅 是 个 开始 ， 本 书 的 许多 地 方 与 计算 机 网 络 协 
以 有 天。 

鉴于 因特网 协议 的 重要 性 ， 每 个 人 就 各 个 协议 及 其 作用 取得 一 致 认识 是 很 重要 的 ， 这 
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EAM ot RE oS i De) PEA ASA in. RIE Ae EAE EH. 因特网 标准 
(Internet standard) 由 因特网 工程 任务 组 (Internet Engineering Task Force, IETF) | IETF 
2012] Æ. IETF 的 标准 文档 称 为 请 求 评论 (Request For Comment, RFC). RFC 最 初 是 
作为 普通 的 请 求 评论 (因此 而 得 名 )， 以 解决 因特网 先驱 者 们 面临 的 网 络 和 协议 问题 
| Allman 2011], RFC 文档 往往 是 技术 性 很 中 并 相当 详细 的 。 它们 定义 卫 TCP、 了 中、HTTP 
(用 于 Web) 和 SMTP (用 于 电子 邮件 ) 等 协 以 ， 目 前 已 经 有 将 近 6000 个 RFC。 其 他 组 织 
也 在 制定 用 于 网 络 组 件 的 标准 ， 最 引 人 注 目的 是 针对 网 络 链 路 的 标准 。 例如 ，IEEE 802 
LAN/MAN 标准 化 委员 会 [IEEE 802 202] 制定 了 以 太 网 和 无 线 Wiki 的 标准 


1.1.2 服务 描述 


前 面 的 讨论 已 经 辨识 了 构成 因特网 的 许多 部 件 . 但 是 我 们 也 能 从 一 个 完全 不 同 的 角 
度 ， 即 从 为 应 用 程序 提供 服务 的 基础 设施 的 角度 来 描述 因特网 。 这 些 应 用 程序 包括 电子 
邮件 、Web 冲浪 、 即 时 讯 奶 、 社 交 网 络 、IP 语音 (VolP) 、 流 式 视 频 、 分 布 式 游戏 、 对 
等 (peer-to-peer, P2P) 文件 共享 、 因 特 网 电视 、 远 程 注册 等 等 。 这 些 应 用 程序 称 为 分 
布 式 应 用 程序 (distributed application) ， 因 为 它们 涉及 多 台 相 互 交 换 数据 的 端 系 统 。 重 
要 的 是 ， 因 特 网 应 用 程序 运行 在 端 系 统 上 ， 即 它们 并 不 运行 在 网 络 核心 中 的 分 组 交换 机 
中 。 尽 管 分 组 交换 机 促进 端 系 统 之 间 的 数据 交换 ， 但 它们 并 不 关心 作为 数据 的 源 或 和 的 
应 用 程序 。 

我 们 稍 深 入 地 探讨 一 下 为 应 用 程序 提供 服务 的 基础 设施 的 含义 :为 此 ， 假 定 你 对 分 布 
式 因特网 应 用 程序 有 一 个 激动 人 心 的 新 思想 ， 它 可 能 大 大 地 造福 于 人 类 ， 或 者 它 可 能 直接 
使 你 罕有 和 出 名 。 你 将 如 何 将 这 种 思想 转换 成 为 一 种 实际 的 因特网 应 用 程序 呢 y 内 为 应 用 
程序 运行 在 端 系统 上 ， 所 以 你 将 需要 编写 运行 在 端 系 统 上 的 一 些 软件 。 例 如， 你 可 能 用 
Java, C 或 Python 编写 软件 。 此 时 ， 因 为 你 在 研发 一 种 分 布 式 因特网 应 用 程序 ， 运 行 在 不 
同 疹 系 统 上 的 软件 将 再 要 互相 发 送 数据 .在 这 里 我 们 碰 到 一 个 核心 问题 ， 这 导致 了 画 一 种 
描述 因特网 的 方法 ， 即 将 因特网 描述 为 应 用 程序 的 平台 。 运 行 在 一 个 端 系 统 上 的 应 用 程序 
怎样 才能 指令 因特网 同 运行 在 男 一 个 端 系统 上 的 软件 发 送 数 据 呢 ? 

与 因特网 相连 的 端 系统 提供 了 一 个 应 用 程序 编程 接口 (Application Programming Interface, 
API), i API 规定 了 运行 在 一 个 端 系统 上 的 软件 请 求 因特网 基础 设施 同和 运行 在 另 一 个 端 系 
统 上 的 特定 目的 地 软件 交付 数据 的 方式 。 因 特 网 API 是 一 套 发 送 软件 必须 遵循 的 规则 集 
合 ， 因 此 因特网 能 够 将 数据 交付 给 目的 地 。 我们 将 在 第 2 曹 详细 讨论 因特网 API IER}, 
我 们 做 一 个 简单 的 类 比 ， 在 本 书 中 我 们 将 经 党 使 用 这 个 类 比 。 假 定 Alice 使 用 邮政 服务 向 


Bob 发 一 封 信 。 当 人 然 ，Alice 不 能 只 是 写 了 这 封 信 (相关 数据 ) 然后 把 该 信和 于 出 窗外 。 相 
反 ， 邮 政 服 务 要 求 Alice 将 信 放 人 一 个 信封 中 ; 在 信封 的 中 央 写 上 Bob 的 全 名 、 地 址 和 邮 


Baw; 封 上 信封 ; 在 信封 的 右上 角 贴 上 邮票 ; 最 后 将 该 信封 丢 进 一 个 邮局 的 邮政 服务 邮 
箱 中 。 因 此 ， 该 邮政 服务 有 自己 的 “邮政 服务 API” 或 一 套 规则 ， 这 是 Alice 必须 遵循 的 ， 
这 样 邮政 服务 才能 将 日 己 的 信件 交付 给 Bob, PIE, 因特网 也 有 一 个 发 送 数 据 的 程序 必须 
EGA) API， 使 因特网 回 接 收 数据 的 程序 交付 数据 

当然 ， 邮 政 服务 回顾 客 提供 了 多 种 服务 ， 如 特快 专递 、 挂 号 、 咨 通 服务 等 ,同样 的 ， 
因特网 回应 用 程序 提供 了 多 种 服务 - 当 你 研发 一 种 因特网 应 用 程序 时 ， 也 必须 为 你 的 应 用 
程序 选择 其 中 的 一 种 因特网 服务 。 我 们 将 在 第 2 草 中 描述 因特网 服务 . 
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我 们 已 经 给 出 了 因特网 的 两 种 描述 方法 : 一 种 是 根据 它 的 硬件 和 软件 组 件 来 描述 ， 另 
一 种 是 根据 基础 设施 向 分 布 式 应 用 程序 提供 的 服务 来 描述 。 但 是 ， 你 也 许 还 是 对 什么 是 因 
寺 网 感到 困惑 。 什 么 是 分 组 交换 ?什么 是 TCP/IP? 什么 是 路 由 器 ? 因特网 中 正在 使 用 什 
么 样 的 通信 和 链 路 ? 什么 是 分 布 式 应 用 程序 ” 一 个 烤箱 或 天 气 传 感 需 怎样 与 因特网 相连 ? 如 
果 现 在 对 这 些 心 存 疑惑 ， 请 不 要 担心 。 这 本 书 的 目的 除了 回 你 介绍 因特网 的 具体 构成 外 ， 


还 要 介绍 制约 因特网 的 工作 方式 和 工作 原理 。 我 们 将 在 后 续 章 抽 中 解释 这 些 重 要 的 术语 和 
问题 。 


1.1.3 什么 是 协议 


既然 我 们 已 经 对 因特网 是 什么 有 了 一 点 印象 ， 那 么 下 面 考 虑 计算 机 网 络 中 态 一 个 重要 
WIN AGE: 协议 。 什 么 是 协议 ?协议 是 用 来 干什么 的 ? 

1. 人 类 活动 的 类 比 

也 许 理解 计算 机 网 络 协 议 概 念 的 一 个 最 容易 办 法 是 ， 先 与 某 些 人 类 活动 进行 类 比 ， 
因为 我 们 人 类 无 时 无 刻 不 在 执行 协议 。 考 虑 当 你 想 要 回 某 人 询问 时 间 时 将 要 怎样 做 。 几 
1-2 中 显示 了 一 种 典型 的 交互 过 程 。 人 类 协议 〈 至 少 说 是 好 的 行为 方式 ) 要 求 一 方 首 先 
进行 问候 (图 1-2 中 的 第 一 个 “你 好 ”)， 以 开始 与 男 一 个 人 的 通信 。 对 “你 好 ”的 上 典 
型 咯 应 是 返回 一 个 “你 好 ” 报 文 。 此 人 用 一 个 热情 的 “你 好 ”进行 啊 应 ， 隐 含 看 一 种 
指示 ， 表 明 能 够 继续 回 那 人 询问 时 间 了 。 对 最 初 的 “你 好 ”的 不 同 啊 应 (例如 “不 要 
烦 我 1" ,或 “我 不 会 说 英语 ”， 或 某 些 不 合 时 宜 的 回答 ) 也 许 表 明了 一 个 勉强 的 或 不 能 
进行 的 通信 。 在 此 情况 下 ， 按照 人 类 协议 ， 发 话 者 也 许 将 不 能 够 询问 时 间 了。 有 时 ， 问 
的 问题 根本 得 不 到 任何 回答 ， 在 此 情况 下 ， 发 话 者 通常 会 放弃 回 这 个 人 询问 时 间 。 注 意 
在 我 们 人 类 协议 中 ， 有 我 们 发 送 的 特定 报 文 ， 也 有 我 们 根据 接收 到 的 应 答 报 文 或 其 他 事 
件 采 取 的 动作 (例如 在 某 个 给 定 的 时 间 内 没有 回答 ) 。 显 然 ， 发 送 和 接收 的 报 文 ， 以 及 
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图 1-2 人 类 协议 和 计算 机 网 络 协议 
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这 些 报 文 发 送 和 接收 或 其 他 事件 出 现时 所 采取 的 动作 ， 这 些 在 一 个 人 类 协议 中 起 到 了 核 
心 作用 。 如 果 人 们 使 用 不 同 的 协议 (例如 ， 如 果 一 个 人 讲 礼 貌 ， 而 男 一 人 不 讲 礼 貌 ， 或 
一 个 人 明白 时 间 这 个 概念 ， 而 男 一 人 却 不 知道 )， 该 协议 就 不 能 互动 ， 因 而 不 能 完成 有 
用 的 工作 。 在 网 络 中 这 个 道理 同样 成 立 。 即 为 了 完成 一 项 工作 ， 要 求 两 个 (或 多 个 ) 
通信 实体 运行 相同 的 协议 。 

我 们 再 考虑 第 二 个 人 类 类 比 的 例子 。 假 定 你 正在 大 学 课堂 里 上 课 (例如 上 的 是 计算 
机 网 络 课程 )。 教 师 正 在 踪 啼 明 叫 地 讲述 协议 ， 而 你 困惑 不 解 。 这 名 教师 停 下 来 问 : 
“同学 们 有 什么 问题 吗 ?” (教师 发 送出 一 个 报 文 ， 该 报 文 被 所 有 没有 睡觉 的 学 生 接 收 到 
T.) 你 举 起 了 手 〈 回 教师 发 送 了 一 个 隐 仿 的 报 文 ) ， 这 位 教师 面 审 微 关 地 示意 你 说 : 
“请 讲 ……” (教师 发 出 的 这 个 报 文 鼓 励 你 提出 问题 ， 教 师 喜 欢 被 问 问题 .) BeA MRA o 
了 问题 ( 即 向 该 教师 传输 了 你 的 报 文 ) 。 教 师 听 取 了 你 的 问题 ( 即 接收 了 你 的 问题 报 
X) 并 加 以 回答 ( 疝 你 传输 了 回答 报 文 )。 我 们 再 一 次 看 到 了 报 文 的 发 送 和 接收 ,以太 
这 些 报 文 发 送 和 接收 时 所 采取 的 一 系列 约定 俗 成 的 动作 ， 这些 是 这 个 “提问 与 回答 ” 
协议 的 核心 。 

2. 网 络 协 议 

网 络 协议 类 似 于 人 类 协议 ， 除 了 交换 报 文 和 采取 动作 的 实体 是 某 些 设备 的 便 件 或 软 
件 组 件 〈 这 些 设 备 可 以 是 计算 机 、 智 能 手机 、 平 板 电 脑 、 路 由 器 或 其 他 具有 网 络 能 力 的 
设备 ) 。 在 因特网 中 ， 凡 是 涉及 两 个 或 多 个 远程 通信 实体 的 所 有 活动 都 受 协议 的 制约 。 
例如 ， 在 两 台 物 理 上 连接 的 计算 机 中 ， 硬 件 实现 的 协议 控制 了 在 两 块 网 络 接口 卡 间 的 
“ 线 上 ”的 比特 流 ; 在 端 系统 中 ， 拥 塞 控制 协议 控制 了 在 发 送 方 和 接收 方 之 间 传 输 的 分 
组 发 送 的 速率 。 协 议 在 因特网 中 到 处 运行 ， 因 此 本 书 的 大 量 篇 幅 与 计算 机 网 络 协议 
有 

以 大 家 可 能 熟悉 的 一 个 计算 机 网 络 协议 为 例 ， 考 虑 当 你 向 一 个 Web WRF at AH ok 
( 即 你 在 Web 浏览 器 中 键入 一 个 Web 网 页 的 URL) 时 所 发 生 的 情况 。 图 1-2 右 半 部 分 显示 
了 这 种 情形 。 首 先 ， 你 的 计算 机 将 向 该 Web 服务 器 发 送 一 条 连接 请 求 报 文 ， 并 等 竺 回答。 
该 Web 服务 句 将 最 终 能 接收 到 连接 请 求 报 文 ， 并 返回 一 条 连接 啊 应 报 文 。 得 知 请 求 该 
Web 文档 正常 以 后 ， 计 算 机 则 在 一 条 GET 报 文中 发 送 要 从 这 台 Web 服务 右上 取 回 的 网 页 
名 字 。 最 后 ，Web 服务 器 癌 计 算 机 返回 该 Web 网 页 (文件)。 

从 上 述 的 人 类 活动 和 网 络 例 子 中 可 见 ， 报 文 的 交换 以 及 发 送 和 接收 这 些 报 文 时 所 采取 
的 动作 是 定义 一 个 协议 的 关键 元 素 : 

一 个 协议 定义 了 在 两 个 或 多 个 通信 实体 之 间 交 换 的 报 文 格式 和 次 序 ， 以 及 报 

文 发 送 和 /或 接收 一 条 报 文 或 其 他 事件 所 采取 的 动作 。 

因特网 (更 一 般 地 说 是 计算 机 网 络 ) 广泛 地 使 用 了 协议 。 不 同 的 协议 用 于 完成 不 同 的 
通信 任务 。 当 你 阅读 完 这 本 书后 将 会 知道 ， 某 些 协议 简单 而 直截了当 ， 而 另 一 些 协议 则 复 
杂 且 星 泡 难 懂 。 掌 握 计 算 机 网 络 领域 知识 的 过 程 就 是 理解 网 络 协议 的 构成 、 原 理 和 工作 方 
式 的 过 程 。 


1.2 网 络 边 绿 
在 上 一 节 中 ， 我 们 给 出 了 因特网 和 网 络 协议 的 总 体 概述 。 现 在 我 们 将 更 深入 一 些 来 探 
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究 计 算 机 网 络 (特别 是 因特网 ) 的 部 件 。 在 本 节 中 ， 我 们 从 网 络 边缘 开始 ， 观 察 一 下 我 们 
更 为 熟悉 的 部 件 ， 即 计算 机 、 智 能 手机 和 我 们 日 常 使 用 的 其 他 设备 。 在 接 下 来 的 一 节 中 ， 
我 们 将 从 网 络 边缘 向 网 络 核心 推进 ， 查 看 计算 机 网 络 中 的 交换 和 选 路 。 





令 人 眼花 弹 乱 的 因特网 端 系 统 


不 久 以 前 ， 与 因特网 相连 的 端 系统 设备 主要 还 是 传统 的 计算 机 ， 如 桌面 机 和 强大 的 
服务 器 。 从 20 世纪 90 年 代 后 期 开始 并 持续 到 今天 ， 各 种 各 样 有 趣 的 设备 开始 与 因特网 
相连 ， 这 些 设 备 都 具有 发 送 和 接收 数字 数据 的 共同 特性 。 考 虑 到 因特网 的 无 所 不 在 ， 以 
及 定义 良好 (标准 ) 的 协议 和 适用 因特网 的 商品 硬件 的 可 用 性 ， 使 用 因特网 技术 将 这 些 
设备 连接 在 一 起 并 同 与 因特网 连接 的 服务 器 相连 是 自然 而 然 的 事 。 

许多 设备 是 在 家 庭 中 使 用 的 ， 其 中 有 视频 游戏 机 (如 微软 公司 的 Xbox), Ai A e 
视 、 能 够 下 载 并 显示 数字 照片 的 数字 相框 、 洗 衣 机 、 电 冰箱 ， 黄 至 下 载 气象 信息 并 将 白 
天 天 气 预 报 (例如 多 云天 气 ) 的 图 像 烙 在 早餐 面包 片上 的 烤 面 包机 [BBC 2001], HA 
GPS 功能 的 IP 电话 能 将 位 置 相关 的 服务 (地 图 、 和 邻近 的 服务 或 人 的 信息 ) MABE, 
谈 入 物理 环境 中 的 联网 传感器 允许 监视 建筑 物 、 桥 梁 、 地 震 活 动 、 野 生动 植物 习性 、 河 
流 江口 和 天 气 。 生 物 医 学 设备 能 够 许 入 和 联网 在 身体 域 网 络 中 。 如 此 多 的 不 同 设备 能 用 
网 络 连 接 在 一 起 ， 因 特 网 确实 变 成 了 一 个 “ 物 联网 ”|[ ITU 2005b]. 


回想 前 一 节 中 计算 机 网 络 的 术语 ， 通 稼 把 与 因特网 相连 的 计算 机 和 其 他 设备 称 为 端 系 
统 。 如 图 1-3 所 示 ， 因 为 它们 位 于 因特网 的 边缘 ， 故 而 被 称 为 端 系统 。 因 特 网 的 端 系统 包 
括 了 桌面 计算 机 (例如 ， 桌 面 PC、Mac 和 Linux &) 、 服 务 器 (例如 ，Web 和 电子 邮件 服 
Sas) 和 移动 计算 机 (例如 ， 便携 机 、 智 能 手机 和 平板 电脑 )。 此 外 ， 越 来 越 多 的 非 传统 
设备 正 被 作为 端 系 统 与 因特网 相连 (参见 “插入 材料 ”)，。 

端 系 统 也 称 为 主机 ， 因 为 它们 容纳 ( 即 运 行 ) 应 用 程序 ， 如 Web 浏览 器 程序 、Web 
服务 天 程 序 、 电 子 邮 件 阅 读 程 序 或 电子 邮件 服务 需 程 序 等 。 本 书 通 篇 将 交 蔡 使 用 主机 和 端 
系统 这 两 个 术语 ， 即 主机 = 端 系统 。 主 机 有 时 又 被 进一步 划分 为 两 类 : 客户 (client) 和 
服务 器 (server), A PARES Ela] Fe PC. Fa) PC 和 智能 手机 等 ， 而 服务 器 非 正 式 
地 等 同 于 更 为 强大 的 机 器 ， 用 于 存储 和 发 布 Web 页 面 、 流 视频 、 中 继 电 子 邮件 等 。 今 天 ， 
大 部 分 提供 搜索 结果 、 电 子 邮件 、Web 页 面 和 视频 的 服务 右 都 属于 大 型 数据 中 心 (data 
center)。 例 如 ， 合 歌 公司 (Google) 拥有 30 ~50 个 数据 中 心 ， 其 中 许多 数据 中 心 都 有 10 
AAV EARS ait. 
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RUE TE “WMA” A JH Be Ae A m a, RiT TEZ ER A 
(access network) , seta hp im A Be E Pe FI H A Be eB A we (edge router) 的 物理 链 路 。 
H ese FH ie ae am AK HE BM A fy H: Ab ae FE i AB EEN EA e AH Aro BI 1-4 A 
的 、 带 阴影 的 线 显 示 了 几 种 类 型 的 接 和 人 链 路 和 使 用 接 和 网 的 几 种 环境 《家庭 、 公 司 和 
广 域 移动 无 线 ) 。 
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1. KREZA: DSL, Wi., FTTH, RGAE 

在 今天 的 发 展 中 国家 中 ， 实 现 因 特 网 接 入 的 家 庭 超过 65% , AIE, E, 
芬兰 和 瑞典 实现 因特网 接 入 的 家 庭 则 超过 80% ， 几 乎 所 有 家 庭 都 是 经 过 高 速 宽带 连接 
LITU 2011 | 。 分 兰 和 瑞典 近期 宣称 高 速 因特网 接 入 是 一 种 “法 定 权 力 ”。 考 虑 到 家 庭 对 网 
络 接 入 的 强烈 兴趣 ， 我 们 从 家 庭 与 因特网 的 连接 开始 介绍 接 入 网 概况 。 

今天 ， 宽 带 住 宅 接 人 有 两 种 最 流行 的 类 型 : 数字 用 户 线 (Digital Subscriber Line, 
DSL) 和 电缆 。 住 户 通常 从 提供 本 地 电话 接 人 的 本 地 电话 公司 处 获得 DSL 因特网 接 入 。 因 
此 ， 当 使 用 DSL 时 ， 用 户 的 本 地 电话 公司 也 是 它 的 ISP。 如 图 1-5 Pros, 每 个 用 户 的 DSL 
Dr) rf] Fee Dd a SEA AMZ KE 1.2. 2 节 中 讨论 ) 与 位 于 本 地 电话 公司 的 
本 地 中 心 局 (CO) 中 的 数字 用 户 线 接 人 复 用 需 (DSLAM) 来 交换 数据 。 家 庭 的 DSL 调制 
解 调 器 得 到 数字 数据 后 将 其 转换 为 高 频 音 ， 以 通过 电话 线 传输 给 本 地 中 心 局 ; 来 自 许 多 家 
庭 的 模拟 信和 号 在 DSLAM 处 被 转换 回 数字 形式 。 
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图 1-4 接 人 网 
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图 1-5 DSL 因特网 接 入 
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家 奢 电 话 线 同 时 承载 了 数据 和 传统 的 电话 信号 ， 它 们 编 但 为 不 同 的 频率 : 

e 高 速 下 行 信道 ， 位 于 50kHz 到 1MHz 频段 ; 

。 中 速 上 行 信 道 ， 位 于 4kHz 到 50kHz 频段 ; 

e 普通 的 双向 电话 信道 ， 位 于 0 到 4kHz 频段 . 

这 种 方法 使 单 根 DSL 线路 看 起 来 就 像 有 3 根 单独 的 线路 ， 因 此 一 个 电话 呼叫 和 一 个 因 
特 网 连接 能 够 同时 共享 DSL 链 路 。(1. 3. 1 节 将 描述 这 种 频 分 复 用 技术 。 ) Rees 户 一 侧 ， 一 
个 分 频 闫 把 到 达 家 庭 的 数据 信号 和 电话 信号 分 隔 开 来 ， 并 将 数据 信号 转发 给 DSL 调制 解 调 
需 。 在 本 地 电话 公司 一 侧 ， 在 本 地 中 心 局 中 ，DSLAM 把 数据 和 电话 信和 号 a 并 将 数 
据 送 往 因 特 网 中 。 数 百 甚至 上 千 个 家 庭 与 同一 个 DSLAM 相连 | Dischinger 2007 | . 

DSL 标准 定义 了 12Mbps 下 行 和 1.8Mbps 上 行 传输 速率 [ITU 1999 | ， 以 及 24Mbps 下 行 
和 2.5Mbps 上 行 传输 速率 [ITU 2003 ] 。 因 为 这 些 上 行 速率 和 下 行 速率 是 不 同 的 ， 所 以 这 种 
接 入 被 称 为 不 对 称 的 。 实 际 取得 的 下 行 和 上 行 传 输 速 率 也 许 小 于 上 述 速 率 ， 因 为 当 DSL 提供 
商 提 供 分 等 级 的 服务 (以 不 同 的 价格 使 用 不 同 的 速率 ) 时 ， 他 们 也 许 有 意 地 限制 住宅 速率 ， 
或 者 因为 家 庭 与 本 地 中 心 局 之 间 的 距离 、 双 绞 线 的 规格 和 电气 干扰 的 程度 而 限制 最 大 的 速 
率 。 工程 师 特 意 为 家 庭 与 本 地 中 心 局 之 间 的 短 距离 接 入 设计 了 DSL; 一 般 而 言 ， 如 果 住 宅 不 
是 位 于 本 地 中 心 局 的 5 ~ 10 英里 范围 内 ， 该 住宅 必须 求助 于 其 他 形式 的 因特网 接 入 ， 

“4 DSL 利用 本 地 电话 公司 现 有 的 本 地 电话 基础 设施 时 ， 电 缆 因 特 网 接 入 (cable Internet 
access) 利用 了 有 线 电 视 公 司 现 有 的 有 线 电视 基础 设施 .住宅 从 提供 有 线 电 视 的 公司 获得 了 
BAAR RIZA. WKI 1-6 所 示 ， 光 缆 将 电缆 头 闪 连接 到 地 区 枢纽 ， 从 这 里 使 用 传统 的 同 轴 
电缆 到 达 各 家 各 户 和 公寓 。 每 个 地 区 枢纽 通常 支持 S00 ~ 5000 个 家 庭 。 因 为 在 这 个 系统 中 应 
用 了 光纤 和 同 轴 电 统 ， 所 以 它 经 常 被 称 为 混合 光纤 同 轴 (Hybrid Fiber Coax, HFC) 。 
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图 1-6 ”一 个 混合 光纤 同 轴 接 人 网 


电缆 因特网 接 和 需要 特殊 的 调制 解 调 器， 称 为 电缆 调制 解 调 堪 (cable modem) 。 如 同 
DSL 调制 解 调 器 ， 电 缆 调制 解 调 器 通常 是 一 个 外 部 设备 ， 通 过 一 个 以 太 网 端 ; 口 连接 到 家 庭 
PC, (RIKER S 章 非 常 详细 地 讨论 以 太 网 ,) AERA m, E A l APE aA] A ita BE FR BE 
(Cable Modem Termination System, CMTS) 起 到 如 同 DSL 网 络 的 DSLAM 类 似 的 功能 ， 即 将 
来 自 许 多 下 行家 庭 中 的 电缆 调制 解 调 右 发 送 的 模拟 信和 号 转换 回 数字 形式 。 电 缆 调 制 解 调 器 
将 HFC 网 络 划 分 为 下 行 和 上 行 两 个 信道 。 如 同 DSL， 接 入 通常 是 不 对 称 的 ， 下 行 信道 通 营 
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分 配 了 比 上 行 信 道 更 高 的 传输 速率 。DOCSIS 2.0 标准 定义 了 高 达 42.8Mbps 的 下 行 速 率 和 
高 达 30. 7Mbps 的 上 行 速 率 。 如 在 DSL 网 络 那 样 ， 由 于 较 低 的 合同 数据 率 或 媒体 损伤 ， 最 
大 可 取得 的 速率 可 能 不 一 定 能 达到 ， | 

电缆 因特网 接 和 人 的 一 个 重要 特征 是 共享 广播 媒体 。 特 别 是 由 头 端 发 送 的 每 个 分 组 回 下 
行经 每 段 链 路 到 每 个 家 庭 ; 每 个 家 庭 发 送 的 每 个 分 组 经 上 行 信道 癌 头 端 传输 。 因 此 ， 如 果 
几 个 用 户 同时 经 下 行 信道 下 载 一 个 视频 文件 ， 每 个 用 户 接收 视频 文件 的 实际 速率 将 大 大 低 
于 电缆 总 计 的 下 行 速 率 。 而 另 一 方面 ， 如 果 仅 有 很 少 的 活跃 用 户 在 进行 Web 冲浪 ， 则 每 
个 用 户 都 可 以 以 下 行 速率 的 全 部 速率 接收 Web 网 页 ， 因 为 用 户 们 将 很 少 在 完全 相同 的 时 
刻 请 求 网 页 。 因 为 上 行 信道 也 是 共享 的 ， 震 要 一 个 分 布 式 多 路 访问 协议 来 协调 传输 和 避免 
ME. 〈 我 们 将 在 第 5 章 中 更 为 详细 地 讨论 碰撞 问题 ,) 

尽管 DSL 和 电缆 网 络 当 前 代表 了 超过 90% 的 美国 住宅 宽带 接 人 ， 但 出 现 了 一 种 承 谤 
更 高 速率 的 新 兴 技 术 ， 即 光纤 到 户 (Fiber To The Home, FTTH) [FTTH Counci 2011a | 。 
AEL, FITH 概念 简单 ， 从 本 地 中 心 局 直接 到 家 庭 提供 了 一 条 光纤 路 径 。 在 美国 ， 
Verizon 因 提 供 FIOS 服务 在 FTTH 方面 特别 有 竞争 力 | Verizon FIOS 2012 | 。 

从 本 地 中 心 局 到 家 庭 有 几 种 部 争 性 的 光纤 分 布 方案 。 最 简单 的 光纤 分 布 网 络 称 为 直接 
光纤 ， 从 本 地 中 心 局 到 每 户 设置 一 根 光纤 。 更 为 一 般 的 是 ， 从 中 心 局 出 来 的 每 根 光 纤 实 际 
上 由 许多 家 庭 共 享 ， 直到 相对 接近 这 些 家 庭 的 位 置 ， 该 光纤 才 分 成 每 户 一 根 光纤 。 进 行 这 
种 划分 的 有 两 种 区 争 性 的 光纤 分 布 体系 结构 : 主动 光纤 网 络 (Active Optical Network, 
AON) 和 被 动 光 纤 网 络 (Passive Optical Network, PON). AON 基本 上 就 是 交换 因特网 ， 
将 在 第 5 章 进 行 讨论 . 

这 里 ， 简 要 讨论 一 下 PON ， 该 技术 用 于 Verizon 的 FIOS 服务 中 。 图 1-7 显示 了 使 用 
PON 分 布 体系 结构 的 FTTH、 每 个 家 庭 具有 一 个 光纤 网 络 端 接 需 (Optical Network Terminator, 
ONT) ， 它 由 专门 的 光纤 连接 到 邻近 的 分 配 郑 (splitter) 。 该 分 配 需 把 一 些 家 庭 〈 通 第 少 于 
100 个 ) 集结 到 一 根 共享 的 光纤 ， 该 光纤 备 连 接 到 本 地 电话 和 公司 的 中 心 局 中 的 光纤 线路 
vagde tir (Optical Line Terminator，OLT) ,该 OLT 提供 了 光 信 号 和 电信 号 之 间 的 转换 ， 经 过 
本 地 电话 公司 路 由 融 与 因特网 相连 。 在 家 庭 中 ， 用 户 将 一 台 家 庭 路 由 器 (通常 是 无 线路 由 
at) 与 ONT 相连 ， 并 经 过 这 人 台 家 庭 路 由 需 接 人 因特网 。 在 PON 体系 结构 中 ， 所 有 从 OLT 
发 送 到 分 配器 的 分 组 在 分 配 圳 〈 类 似 于 一 个 电费 头 端 ) 处 复制 。 
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图 1-7 FTTH 因特网 接 人 
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不 同 速率 选择 ， 较 高 的 速率 自然 花费 更 多 。 美 国 FTTH 用 户 在 2011 年 的 平均 下 行 速率 大 约 
为 20Mbps (与 13Mbps 电缆 接 入 网 相当 ， 而 小 于 $Mbps DSL) [FTTH Council 2011b] 。 

还 可 采用 另外 两 种 接 和 人 网 技术 为 家 庭 提 供 因 特 网 接 人 。 在 无 法 提供 DSL、 电 缆 和 
FTTH 的 地 方 ( 例如 在 某 些 乡村 环境 )， 能 够 使 用 卫星 链 路 将 住宅 以 超过 1Mbps 的 速率 
与 因特网 相连 。StarBand 和 HughesNet 是 两 家 这 样 的 卫星 接 入 提供 商 。 使 用 传统 电话 线 
的 拨号 接 人 与 DSL 基于 相同 的 模式 : 家 庭 的 一 只 调制 解 调 需 经 过 电话 线 连 接 到 ISP 中 的 
一 只 调制 解 调 融 。 与 DSL ALEC SE r REA RFA, eS eA 56kbps 的 慢 速 率 是 令 人 痛 
苦 的 。 

2. 企业 (MKE) FRA: 以 太 网 和 WiFi 

在 公司 和 大 学 校园 以 及 在 越 来 越 多 的 家 庭 环境 中 ， 通 常 是 用 局 域 网 ( LAN) 将 端 用 户 
连接 到 边缘 路 由 器 。 尽 管 有 许多 不 同类 型 的 局 域 网 技术 ,但 是 以 太 网 到 目前 为 止 是 当前 公 
司 、 大 学 和 家 庭 网 络 中 最 为 流行 的 接 和 技术。 如 岁 1-8 中 所 示 ， 以 太 网 用 户 使 用 双 绞 铜 线 
与 一 台 以 太 网 交换 机 相连 ， 第 $ 章 中 将 详细 讨论 该 技术 。 以 太 网 交换 机 或 这 样 相连 的 交换 
机 网 络 ， 则 再 与 更 大 的 因特网 相连 。 使 用 以 太 网 接 入 ， 用 户 通 常 以 100Mbps 速率 接 人 以 太 
网 到 换 机 ， 而 服务 名 可 能 有 具有 1Cbps 甚至 10Cbps AYRE A EX . 
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图 1-8 以 太 网 因特网 接 入 


然而 ， 越 来 越 多 的 人 从 便携 机 、 智 能 手机 、 平 板 电 脑 和 其 他 设备 无 线 接 入 因特网 ( 参 
见 前 面 的 插入 内 容 “ 令 人 眼花 综 乱 的 因特网 端 系 统 ”) 。 在 无 线 LAN 环境 中 ， 无 线 用 户 从 / 
到 一 个 接 和 人 点 发 送 /接收 分 组 ， 该 接 人 点 与 企业 网 连接 (很 可 能 包括 有 线 以 太 网 ) ， 该 企业 
网 再 与 有 线 因 特 网 相连 。 一 个 无 线 LAN 用 户 通常 必须 位 于 接 人 点 的 几 十 米 范 围 内 。 基 于 
IEEE 802. 11 技术 的 无 线 LAN 接 人 ， 更 为 通俗 地 称 为 WiFi， 目 前 几乎 无 所 不 在 ， 如 大 学 、 
商业 办 公 室 、 咖 啡 厅 、 机 场 、 家 庭 ， 甚 至 在 飞机 上 。 在 许多 城市 ， 人 们 能 够 站 在 街角 而 位 
于 10 或 20 个 基站 范围 内 (对 于 可 浏览 的 802. 11 基站 全 局 图 一 一 这 些 基站 由 那些 非常 热 
心 做 这 种 事情 的 人 发 现 并 记载 在 Web 站 点 上 ， 参 见 [wigle. net 2012 ] ) 。 如 在 第 6 章 详 细 
讨论 的 那样 ，802. 11 今天 提供 了 高 达 54Mbps 的 共享 传输 速率 。 

即使 以 太 网 和 WiFi 接 入 网 最 初 是 设置 在 企业 (公司 或 大 学 ) 环境 中 的 ,但 它们 近来 
也 已 经 成 为 家 庭 网 络 中 相对 常见 的 部 件 。 今 天 许多 家 庭 正在 将 宽带 住宅 接 入 ( 即 电 缆 调 制 
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解 调 硕 或 DSL) 与 廉价 的 无 线 局 域 网 技术 结合 起 来 ， 以 产生 强大 的 家 用 网 络 [ Edwards 
2011] ,图 1-9 显示 了 典型 的 家 硅 网 络 。 这 个 家 硅 网 络 组 成 如 下 : 一 台 漫 游 的 便携 机 和 1 
RA PC; 一 个 与 无 线 PC 通信 的 基站 (无 线 接 入 点 ); 一 个 提供 与 因特网 宽带 接 和 的 电 
A ie iil Eel am; 以 及 一 全 互联 基站 及 市 有 电 红 调制 解 调 各 的 固定 PC 的 路 由 如 。 该 网 绍 
允许 家 寿 成 员 经 宽 市 技 和 因特网， 其 中 一 个 成 员 可 以 在 厨房 、 院 子 或 耻 室 漫游 上 网 。 


电缆 头 端 -全 下 因特网 





图 1-9 一 个 典型 的 家 庭 网 络 的 示意 图 


3. 广 域 无 线 接 人 : 3G 和 LTE 

iPhone 、 黑 每 和 安 早 等 设备 越 来 越 多 地 用 来 在 移动 中 发 送 邮 件 、Web 冲浪 、 推 特 和 下 
载 音 乐 。 这 些 设备 应 用 了 与 移动 电话 相同 的 基础 设施 ， 通 过 蜂 寅 网 提供 商 运 营 的 基站 来 发 
送 接收 分 组 。 与 Wiki 不 同 的 是 ， 一 个 用 户 仅 需要 位 于 基站 的 数 万 米 (而 不 是 几 十 米 ) 范 
HIN 

电信 公司 已 经 在 所 谓 第 三 代 3G) 无 线 技 术 中 进行 了 大 量 投资 ，36 为 分 组 交换 广 域 
无 线 因 特 网 接 人 提供 了 超过 1Mbps 的 速率 。 甚 至 更 高 速率 的 广 域 接 人 技术 及 第 四 代 (4G) 
广 域 无 线 网 络 已 经 在 部 署 中 。LTE ( “Long-Term Evolution” 的 缩写 ， 被 评 为 最 差 首 字母 缩 
写 词 年 度 奖 候选 者 ) 来 源 于 3G 技术 ， 它 能 够 取得 超过 10Mbps 的 速率 。 几 十 Mbps 的 LTE 
下 行 速率 已 经 在 商业 部 署 中 得 到 应 用 。 我 们 将 在 第 6 章 中 涉及 无 线 网 络 和 移动 性 以 及 
WiFi、3C 和 LTE 等 技术 的 基本 原则 。 


1.2.2 物理 媒体 


在 前 面 的 内 容 中 ， 我 们 概述 了 因特网 中 的 茶 些 最 为 重要 的 网 络 接 入 技术 。 当 我 们 描 
述 这 些 技术 时 ， 我 们 也 指出 了 所 使 用 的 物理 媒体 。 例 如 ， 我 们 说 过 HPC 使 用 了 光缆 和 
同 轴 电 缆 相 结合 的 技术 。 我 们 说 过 DSL 和 以 太 网 使 用 了 双 绞 铜 线 。 我 们 说 过 移动 接 入 网 
使 用 了 无 线 电 频谱 。 在 这 一 三 中 ， 我 们 简要 概述 一 下 这 些 和 其 他 常 在 因特网 中 使 用 的 传 
输 媒 体 。 

为 了 定义 物理 媒体 所 表示 的 内 容 ， 我 们 仔细 思考 一 下 一 个 比特 的 短暂 历程 。 考 虑 一 个 
比特 从 一 个 闪 系 统 开始 传输 ， 通 过 一 系列 链 路 和 路 由 郑 ， 到 达 玉 一 个 疹 系统 。 这 个 比特 被 
传输 许 许 多 多 次 ! 源 病 系统 首先 传输 这 个 比特 ， 不 和 久 后 其 中 的 第 一 台 路 由 器 接收 该 比特 ; 
第 一 台 路 由 顺 传 输 该 比特 ， 接 着 不 久 后 第 二 台 路 由 器 接收 该 比特 ; 等 等 。 因 此 ， 这 个 比特 
当 从 源 到 目的 地 传输 时 ， 通 过 一 系列 “传输 需 - 接收 右 ” 对 。 对 于 每 个 传输 器 - 接收 器 
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对 ， 通 过 跨越 一 种 物理 媒体 (physical medium) 传播 电磁 波 或 光 脉 冲 来 发 送 该 比特 。 该 物 
理 媒体 可 具有 多 种 形状 和 形式 ， 并 且 对 沿途 的 每 个 传输 融 - 接收 需 对 而 言 不 必 具 有 相同 的 
类 型 。 物 理 媒 体 的 例子 包括 双 绞 铜 线 、 同 轴 电 绕 、 多 模 光 纤 绕 、 陆 地 无 线 电 频谱 和 卫星 无 
线 电 频谱 。 物 理 媒 体 划 分 为 两 类 : 导 引 型 媒体 (guided media) 和 非 导 引 型 媒体 (unguided 
media)。 对 于 导 5 引 型 媒体 ， 电 波 沿 着 固体 媒体 前 行 ， 如 光线 、 双 绞 铜 线 或 同 轴 电 绕 。 对 于 
非 导 引 型 媒体 ， 电 波 在 空气 或 外 层 空 间 中 传播 ， 例 如 在 无 线 局 域 网 或 数字 卫星 频道 中 . 

在 深入 讨论 各 种 媒体 类 型 的 特性 之 前 ， 我 们 简要 地 讨论 一 下 它们 的 成 本 。 物 理 链 路 
( 铜 线 、 光 缆 等 ) 的 实际 成 本 与 其 他 网 络 成 本 相 比 通常 是 相当 小 的 。 特 别 是 安 疙 物理 链 路 
的 劳动 力 成 本 能 够 比 材 料 成 本 高 几 个 数量 级 。 正 因为 这 个 原因 ， 许 多 建筑 商 在 一 个 建筑 物 
中 的 每 个 房间 中 安装 了 了 双 绞 线 、 光 缆 和 同 轴 电 绕 。 即 使 最 初 仅 使 用 了 一 种 媒体 ， 在 不 远 的 
将 来 也 可 能 会 使 用 为 一 种 媒体 ， 这 样 将 来 不 必 上 由 铺 设 男 外 的 线 绕 ， 从 而 三省 了 经 费 . 

1. 双 绞 铜 线 

最 便宜 并 且 使 用 最 为 普遍 的 引导 型 传输 媒体 是 双 绞 铜 线 。 一 百 多 年 来 ， 它 一 直 几 于 电 
话 网 ,事实 上 ， 从 电话 机 到 本 地 电话 交换 机 超过 99% 的 连 线 使 用 的 是 双 绞 铜 线 。 我 们 多 数 
人 在 自己 的 家 庭 和 工作 环境 中 已经 看 到 过 双 绞 线 。 双 绞 线 由 两 根 隔离 的 铜 线 组 成 ， 每 根 大 
2) 1mm 粗 ， 以 规则 的 螺旋 形式 排列 着 。 这 两 根 线 被 绞 合 起 来 ， 以 减少 来 自 邻 近 类 似 的 双 
绞 线 的 电气 干扰 。 通 常 许多 双 绞 线 捆扎 在 一 起 形成 一 根 电 绕 ， 并 在 这 些 双 绞 线 外 面 窗 盖 上 
保护 性 防护 层 。 一 对 电线 构成 了 一 个 通信 链 路 。 无 屏蔽 双 绥 线 ( Unshielded Twisted Pair, 
UTP) 管用 在 建筑 物 内 的 计算 机 网 络 中 ， 即 用 于 局 域 网 (LAN) P HATE Sa PX PY) AL He 
线 的 数据 速率 从 10Mbps 到 10Gbps。 所 能 达到 的 数据 传输 速率 取决 于 线 的 粗细 以 及 传输 方 
和 接收 方 之 间 的 距离 。 

20 世纪 80 年 代 出 现 光纤 技术 时 ， 许 多 人 因为 双 绞 线 比 特 速 率 低 而 轻视 它 ， 茶 些 人 其 
至 认为 光纤 技术 将 完全 代 蔡 双 绞 线 。 但 双 绞 线 不 是 那么 容易 被 抛弃 的 。 现 代 的 双 绞 线 技术 
例如 6a 类 电缆 能 够 达到 10Gbps 的 数据 传输 速率 ， 距 离 长 达 100m。 双 绞 线 最 终 已 经 作为 
高 速 LAN 联网 的 主要 方式 。 

如 前 面 讨 论 的 那样 ， 双 绞 线 也 经 凋 用 于 住宅 因特网 接 入 。 我 们 看 到 ， 拨 号 调制 解 调 大 
技术 通过 双 绞 线 能 以 高 达 56kbps 的 速率 接 人 。 我 们 也 看 到 ， 数 字 用 户 线 (DSL) 技术 通过 
双 绞 线 使 住宅 用 户 以 超过 数 十 Mbps 的 速率 接 人 因特网 〈 当 用 户 靠近 ISP 的 调制 解 调 融 后 
住 时 ) 。 

2. 同 轴 电 线 

与 双 绞 线 类 似 ， 同 轴 电 绕 由 两 个 铜 导 体 组 成 ,但 是 这 两 个 导体 是 同心 的 而 不 是 并 行 
的 。 借 助 于 这 种 结构 及 特殊 的 绝缘 体 和 保护 层 ， 同 轴 电 缆 能 够 达到 较 高 的 数据 传输 速 
率 。 同 轴 电 绕 在 电缆 电视 系统 中 相当 普遍 。 我 们 前 面 已 经 看 到 ， 电 绕 电 视 系 统 最 近 与 电 
缆 调 制 解 调 器 结合 起 来 ， 为 住宅 区 用 户 提供 数 十 Mbps 速率 的 因特网 接 入 。 在 电缆 电视 
和 电缆 因特网 接 入 中 ， 发 送 设 备 将 数字 信号 调制 到 某 个 特定 的 频段 ， 产生 的 模拟 信和 号 从 
发 送 设备 传送 到 一 个 或 多 个 接收 方 。 同 轴 电 缆 能 被 用 作 导 引 型 共享 媒体 (shared medium) 。 
特别 是 ， 许 多 端 系统 能 够 直接 与 该 电缆 相连 ， 每 个 端 系统 都 能 接收 由 其 他 闪 系 统 发 送 的 
东西 。 
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3. 光纤 

光纤 是 一 种 细 而 柔软 的 、 能 够 导 引 光 脉 冲 的 媒体 ， 每 个 脉冲 表示 一 个 比特 。 一 根 光纤 
能 够 支持 极 高 的 比特 速率 ， 高 达 数 十 甚至 数 百 Gbps。 它 们 不 受 电 磁 干 扰 ， 长 达 100km 的 
光缆 信号 训 减 极 低 ， 并 且 很 难 窃 听 。 这 些 特 征 使 得 光纤 成 为 长 途 引 导 型 传输 媒体 ， 特 别 是 
跨 海 链 路 。 在 美国 和 别 的 地 方 ， 许 多 长 途 电话 网 络 现在 全 面 使 用 光纤 ， 光 纤 也 广泛 用 于 因 
FEIT. SRI, MAAC, UNA A. PEW a CHR, BA GOGAT TE Re Re fi 
中 的 应 用 ， 如 在 LAN 或 家 庭 接 入 网 中 就 不 使 用 它们 。 光 载波 (Optical Carrier, OC) 标准 


n x51.8Mbps。 目 前 正在 使 用 的 标准 包括 OC-1, OC-3, OC-12, OC-24, OC-48, OC-96, 
OC-192 、0OC-768。|[ Mukherjee 2006, Ramaswamy 2010] 提供 了 光纤 网 络 各 方面 的 知识 。 

4. 陆地 无 线 电 信道 

无 线 电 信道 承载 电磁 频谱 中 的 信号 。 它 不 需要 安装 物理 线路 ， 并 具有 和 穿 透 墙壁 、 提 供 
与 移动 用 户 的 连接 以 及 长 距离 承载 信号 的 能 力 ， 因 而 成 为 一 种 有 吸引 力 的 媒体 。 无 线 电信 
井 的 特性 极 大 地 依赖 于 传播 环境 和 传输 信号 的 距离 ,环境 上 的 考虑 取决 于 路 径 损 耗 和 和谈 挡 
衰 沙 〈 即 当 信 号 器 距离 传播 和 绕 过 /通过 阻碍 物体 时 信号 降低 蚂 度 ) 、 多 径 襄 洲 CA 
扰 对 象 的 信号 反射 ) 以 及 干扰 (由 于 其 他 无 线 电信 和 道 或 电磁 信号 ) 。 

陆地 无 线 电 信道 能 够 大 致 划 分 为 三 类 : 一 类 运行 在 很 短 距 离 (如 1 米 或 2 米 ); 为 一 类 
运行 在 局 域 ， 通 第 跨越 数 十 到 几 百 米 ; 第 三 类 运行 在 广 域 ， 跨越 数 万 米 。 个 人 设备 如 无 线头 
戴 式 耳机 、 键 盘 和 医疗 设备 路 短 距离 运行 ; 在 1.2.1 市 中 描述 的 无 线 LAN 拉 术 使 用 了 局 域 无 
线 电 信道 ; 蜂 禽 接 入 技术 使 用 了 广 域 无 线 电 人 信道。 我们 将 在 第 6 草 中 详细 讨论 无 线 电 信道 。 

5. 卫星 无 线 电信 道 

一 颗 通信 卫星 连接 两 个 或 多 个 位 于 地 球 的 微波 发 射 方 / 接 收 方 ,它们 被 称 为 地 面 站 。 
该 卫星 在 一 个 频段 上 接收 传输 ， 使 用 一 个 转发 表 (下 面 讨论 ) 再 生 信号 ， 并 在 另 一 个 频率 
上 传输 信和 号。 通信 中 和 常 使 用 两 类 卫星 : 同步 卫星 (geostationary satellite) 和 近 地 轨 道 
(Low- Earth Orbiting, LEO) 卫星 。 

同步 卫星 永久 地 停留 在 地 球 上 方 的 相同 点 上 。 这 种 静止 存在 是 通过 将 卫星 放置 在 地 球 
表面 上 方 36 000km 的 轨道 上 而 取得 的 。 从 地 面 站 到 卫星 再 回 到 地 面 站 的 巨大 距离 引入 了 
280ms 的 可 观 的 信号 传播 时 延 。 不 过 ， 能 以 数 百 Mbps 速率 运行 的 卫星 链 路 ,经 常用 在 那 
些 无 法 使 用 DSL 或 电 红 因特网 接 入 的 区 域 。 

近 地 轨 道 卫 星 放 管 得 非常 徘 近 地 球 ， 并 有 旦 不 是 永久 地 停留 在 地 球 上 方 的 一 个 点 。 它 们 
围绕 地 球 旋 转 ， 就 像 月 亮 围绕 地 球 旋转 那样 。 为 了 提供 对 一 个 区 域 的 连续 罗兰 ， 需 要 在 轨 
道上 放置 许多 卫星 。 当 前 有 许多 低 轨道 通信 系统 在 研制 中 。Lioyd 的 卫星 星座 Web 页 
[ Wood 2012] 提供 和 收集 了 关于 通信 用 卫星 星座 系统 的 信息 。 近 地 轨道 卫星 技术 未 来 也 许 
能 够 用 于 因特网 接 入 。 


1.3 网 络 核心 


在 考察 了 因特网 边 绿 后， 我们 现在 更 深入 地 人 研究 网 络 核 心 ， 即 由 互联 因特网 端 系统 的 
分 组 交换 机 和 链 路 构成 的 网 状 网 络 。 图 1-10 用 加 粗 阴影 线 勾 画 出 网 络 核 心 部 分 。 
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图 1-10 网络 核心 


1. 3.1 分 组 交换 


在 各 种 网 络 应 用 中 ， 闪 系统 彼此 交换 报 文 (message) 。 报 文 能 够 包含 协议 设计 者 再 要 
的 任何 东西 。 报 文 可 以 执行 一 种 控制 功能 (例如 ,图 1-2 所 示例 子 中 的 “你 好 ” 报 文 )， 
也 可 以 包含 数据 ， 例 如 电子 邮件 数据 、JPEG 图 像 或 MP3 音频 文件 。 为 了 从 源 端 系统 同日 
的 端 系统 发 送 一 个 报 文 ， 源 将 长 报 文 划分 为 较 小 的 数据 块 ， 称 之 为 分 组 (packet). 在 源 和 
目的 之 间 ， 每 个 分 组 都 通过 通信 和 链 路 和 分 组 交换 机 (packet switch) (交换 机 主要 有 两 类 : 
Pe A ae FUSER EFRBL) 传送 。 分 组 以 等 于 该 链 路 最 大 传输 速率 的 速度 传输 通过 通信 和 链 
路 。 因 此 ， 如 果 某 源 端 系统 或 分 组 交换 机 经 过 一 条 链 路 发 送 一 个 上 比特 的 分 组 ， 链 路 的 传 
WEKKA R 比特 / 秒 ， 则 传输 该 分 组 的 时 间 为 LAR BP. 

1. 存储 转发 传输 

多 数 分 组 交换 机 在 链 路 的 输入 端 使 用 存储 转发 传输 (store- and- forward transmission ) 
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HLR CFE AAL ETE TE CFR OL BE I FF ka l i ih SEP TK OP HBE RS, 
ALPE WN BN BE PEL A BCA PEAR TF ae Ace, Se rN S28 Ah A ETE 
ing Fs he Fo) AMY fa) LZ, GAL 1-11 Aan. 一 台 路 由 融通 常 有 多 条 繁忙 的 链 路 ， 因 为 它 的 
任务 就 是 把 一 个 入 分 组 交换 到 一 条 出 链 路 ,在 这 个 简单 例子 中 ， 该 路 由 占 的 任务 相当 简 
H: 将 分 组 从 一 条 (输入 ) 链 路 转移 到 另 一 条 叭 一 的 连接 链 路 。 在 网 1-11 所 示 的 特定 时 
刻 ， 源 已 经 传输 了 分 组 1 的 一 部 分 ， 分 组 1 的 前 洛 已 经 到 达 了 路 由 需 。 因 为 该 路 由 需 应 用 
了 人 存储 转发 机 制 ， 所 以 此 时 它 还 不 能 传输 已 经 接收 的 比特 ， 而 是 必须 先 缓存 ( 即 “ 存 
储 ”) 该 分 组 的 比特 。 仪 当 路 由 右 已 经 接收 完了 该 分 组 的 所 有 比特 后 ， 它 才能 开始 向 出 链 
路 传输 CH RR”) 该 分 组 ， 为 了 深刻 领悟 存储 转发 传输 ， 我 们 现在 计算 一 下 从 源 开 始 
发 送 分 组 到 目的 地 收 到 整个 分 组 所 经 过 的 时 间 。 (这 里 我 们 将 忽略 传播 时 延 一 一 指 这 些 比 
特 以 接近 光速 的 速度 跨越 线路 所 需要 的 时 间 ， 这 将 在 1.4 节 讨论 -) 源 在 时 刻 0 开始 传输 ， 
在 时 刻 AR 秒 ， 央 为 该 路 由 希 刚 好 接收 到 整个 分 组 ， 所 以 它 能 人 够 朝 着 目的 地 回 出 链 路 开始 
传输 分 组 ; 在 时 刻 22XLR， 路 由 器 已 经 传输 了 整个 分 组 ， 并 且 整 个 分 组 已 经 被 目的 地 接收 . 
所 以 ， 总 时 延 是 2LAR。 如 果 交 换 机 一 旦 比特 到 达 就 转发 比特 (不 必 首 先 收 到 整个 分 组 ) ， 
则 因为 比特 没有 在 路 由 器 保持 ， 总 时 延 将 是 LR。 而 如 我 们 将 在 1.4 节 中 讨论 的 那样 ， 路 
有 由 硕 在 和 转发 前 震 要 接收 、 存 储 和 处 理 整个 分 组 . 
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源 分 组 ! 的 前 面部 分 存储 在 路 由 器 目的 地 
中 ， 在 转发 前 等 待 余下 的 比特 


图 1-11 存储 转发 分 组 交换 


现在 我 们 来 计算 从 源 开 始 发 送 第 一 个 分 组 直到 目的 地 接收 到 所 有 三 个 分 组 所 需 的 时 
lH). 与 前 面 一 样 ， 在 时 刻 2R， 路 由 器 开始 转发 第 一 个 分 组 。 而 在 时 刻 L/R 源 也 开始 发 送 
第 二 个 分 组 ， 因 为 它 已 经 完成 了 发 送 整 个 第 一 个 分 组 。 因 此 ， 在 时 刻 2LAR， 目 的 地 已 经 
收 到 第 一 个 分 组 并 且 路 巾 需 已 经 收 到 第 二 个 分 组 . 类 似 地 ， 在 时 刻 3ZR， 目 的 地 已 经 收 
色 前 两 个 分 组 并 且 路 由 硕 已 经 收 到 第 三 个 分 组 。 最 后 ， 在 时 刻 4LAR， 目 的 地 已 经 收 到 所 
有 3 个 分 组 ! 

我 们 现在 来 考虑 通过 由 N 条 速率 均 为 R 的 链 路 组 成 的 路 径 (所 以 ， 在 源 和 目的 地 之 
HAN-1 人 台 路 由 硕 ) ， 从 源 到 目的 地 发 送 一 个 分 组 的 总 体 情 况 。 应 用 如 上 相同 的 逻辑 ， 我 
们 看 到 端 到 端 时 延 是 : 

dss = NZ t-f) 


你 也 许 现在 要 试 着 确定 P 个 分 组 经 过 NN 条 链 路 序列 的 时 延 有 多 大 。 

2. 排队 时 延 和 分 组 丢失 

每 个 分 组 交换 机 有 多 条 链 路 与 之 相连 。 对 于 每 条 相连 的 链 路 ， 该 分 组 交换 机 具有 一 个 
输出 缓存 (output buffer) (也 称 为 输出 队列 output queue) ， 它 用 于 存储 路 由 天 准备 发 往 那 
条 链 路 的 分 组 。 该 输出 缓存 在 分 组 交换 中 起 着 重要 的 作用 。 如 果 到 达 的 分 组 需要 传输 到 某 
条 链 路 ， 但 发 现 该 链 路 正 忙 于 传输 其 他 分 组 ， 该 到 达 分 组 必须 在 该 输出 缓存 中 等 待 。 因 
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此 ， 除 了 存储 转发 时 延 以 外 ， 分 组 还 要 承受 输出 绥 存 的 排队 时 延 (queue delay) .这 些 时 
延 是 变化 的 ， 变 化 的 程度 取决 于 网 络 中 的 拥 寡 程度。 因为 缓存 空间 的 大 小 是 有 限 的 ， 一 个 
到 达 的 分 组 可 能 发 现 该 缓存 已 被 其 他 等 待 传输 的 分 组 完全 充满 了 -在 此 情况 下 ， 将 出 现 分 
组 丢失 (EE) (packet lost)， 到 达 的 分 组 或 已 经 排队 的 分 组 之 一 将 被 丢弃 

图 1-12 显示 了 一 个 简单 的 分 组 交换 网 络 。 如 在 图 1-11 中 ,分 组 被 表示 为 3 AED 
切片 的 宽度 表示 了 了 该 分 组 中 比特 的 数量 .在 这 张 岁 中 ， 所 有 分 组 具有 相同 的 宽度 ， 因 此 有 
相同 的 长 度 。 假 定 主机 A 和 B HENLE 发 送 分 组 。 主机 A A B 先 通 过 10Mbps 的 以 太 网 链 
路 问 第 一 个 路 由 大 发 送 分 组 。 该 路 由 需 则 将 这 些 分 组 导 回 到 一 条 1. 5Mbps WHER WMR YE 
采 个 短 时 间 间 隅 中 ， 分 组 到 达 路 由 需 的 到 达 率 (转换 为 每 秒 比 特 ) 超过 了 1.5Mbps， 这 些 
分 组 在 通过 链 路 传输 之 前 ， 将 在 链 路 输出 缓存 中 排队 ， 在 该 路 由 规 中 将 出 现 拥 蹇 。 例如， 
Qn EOL A 和 主机 B 每 个 部 同时 发 送 了 5 个 紧 接 着 的 分 组 突 发 块 ， 则 这 些 分 组 中 的 大 多 数 
将 在 队列 中 等 待 一 些 时 间 。 事 实 上 ， 这 完全 类 似 于 每 天 都 在 经 历 的 一 些 情 况 ， 例 如 当 我 们 
在 银行 柜台 前 排队 等 竺 或 在 过 路 收费 站 前 等 竺 时 。 我 们 将 在 1.4 节 中 更 为 详细 地 全 究 这 种 
HEBA HSF Sib , 






Fy 10Mbps 以 太 网 


路 的 分 组 队列 


图 1-12 分 组 交换 


3. 转发 表 和 路 由 选择 协议 

采 面 我 们 说 过 ， 路 由 器 从 与 它 相 连 的 一 条 通信 和 链 路 得 到 分 组 ， 将 其 向 与 它 相 连 的 为 一 
条 通信 和 链 路 转发 。 但 是 该 路 由 紫 怎 样 决定 它 应 当 问 哪 条 链 路 进行 转发 呢 ?” 不 同 的 计算 机 网 
络 实 际 上 是 以 不 同 的 方式 完成 的 。 这 里 ， 我 们 简要 介绍 在 因特网 中 所 采用 的 方法 。 

在 因特网 中 ， 每 个 闪 系 统 具 有 一 个 称 为 IP 地 址 的 地 址 。 当 源 主机 要 癌 目 的 端 系 统 发 
送 一 个 分 组 时 ， 源 在 该 分 组 的 首部 包含 了 目的 地 的 IP 地 址 。 如 同 邮 政 地 址 那样 ， 该 地 址 
具有 一 种 等 级 结构 。 当 一 个 分 组 到 达 网 络 中 的 路 由 需 时 ， 路 由 器 检查 该 分 组 的 目的 地 址 的 
一 部 分 ， 并 回 一 台 相 邻 路 由 需 转 发 该 分 组 。 更 特别 的 是 ,每 台 路 由 器 具有 一 个 转发 表 
(forwarding table) ， 用 于 将 目的 地 址 (或 目的 地 址 的 一 部 分 ) 映射 成 为 输出 链 路 。 当 某 分 
组 到 达 一 人 台 路 由 需 时 ， 路 由 需 检 查 该 地 址 ， 并 用 这 个 目的 地 址 搜索 其 转发 表 ， 以 发 现 适 当 
的 出 链 路 ， 路 由 郑 则 将 分 组 导 回 该 出 链 路 

闪 到 闪 选 路 过 程 与 一 个 不 使 用 地 图 而 喜欢 问 路 的 汽车 驾驶 员 相 类 似 . 例如 ， 假 定 Joe 
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25 AE MA Be BI fo S FGA | LS THT AY Lakeside Drive ( 156 5, Joe 7625 Æ I) bt ar AY J yh 
站 、 询 问 怎样 才能 到 达 佛 罗 里 达州 奥兰多 市 的 Lakeside Drive ff 156 > J A AYRI 5s 
从 该 地 址 中 抽取 了 佛罗里达 州 部 分 ， 告诉 Joe 他 需要 上 1-95 责 州 际 公 路 ， 该 公路 愉 有 一 个 
邻近 该 加 油 站 的 入 口 。 他 又 告诉 Joe, 一 旦 到 了 佛罗里达 后 应 当 再 问 当 地 人 。 于 是 ，Joe 上 
J 1-95 南 州 际 公 路 ， 一 直到 达 佛 软 里 达 的 Jacksonville， 在 填 里 他 癌 男 一 个 加 油 丫 服务员 问 
路 。 该 服务 员 从 地 址 中 抽取 了 奥兰多 市 部 分 ,告诉 Joe 他 应 当 继 续 沿 1-95 公路 到 Daytona 
海滩 ， 然 后 再 问 其 他 人 ， 在 Daytona 海滩 的 为 一 个 加 油 站 服务 员 也 抽取 该 地 址 的 奥兰多 部 
分 ， 告 诉 Joe 应 当 走 1-4 公路 直接 前 往 奥 兰 多 。jJoe 走 了 工 4 公路 ， 并 从 奥兰多 出 口 下 来 。 
Joe 又 向 另 一 个 加 油 站 的 服务 员 询问 ， 这 时 该 服务 员 抽 取 了 该 地 址 的 Lakeside Drive 部 分 ， 
告诉 了 Joe 到 Lakeside Drive 必须 要 走 的 路 。 一 旦 Joe 到 达 了 Lakeside Drive， 他 回 一 个 骑 月 
行车 的 小 孩 询问 了 到 达 目 的 地 的 方法 .这 个 孩子 抽取 了 了 该 地 址 的 156 号 部 分 ， 并 指示 了 房 
屋 的 方向 。jJoe 最 后 到 达 了 最 终日 的 地 。 在 上 述 类 比 中 ， 那 些 加 油 站 服务 员 和 骑 车 的 孩子 
可 类 比 为 路 由 带 。 

我 们 刚刚 学 习 了 路 由 需 使 用 分 组 的 目的 地 址 来 对 引 转 发 表 并 决定 适当 的 出 链 路 。 但 是 
这 个 叙述 还 要 求 回答 另 一 个 问题 : 转发 表 是 如 何 进行 设置 的 ?” 是 通过 人 工 对 每 台 路 由 需 逐 
台 进 行 配置 ， 还 是 因特网 使 用 更 为 自动 的 过 程 进行 设置 呢 ? 第 4 和 草 将 深信 人 探讨 这 个 问题 。 
但 在 这 里 为 了 激发 你 的 求知 欲 ， 我 们 现在 将 告诉 你 因特网 具有 一 些 特殊 的 路 由 选择 协议 
(routing protocol) ， 用 于 自动 地 设置 这 些 转发 表 。 例 如 ， 一 个 路 由 选择 协议 可 以 决定 从 每 
台 路 由 需 到 每 个 目的 地 的 最 短路 径 ， 并 使 用 这 些 最 短路 径 结 末 来 配置 路 由 震中 的 转发 表 。 

怎样 才能 实际 看 到 分 组 在 因特网 中 所 走 的 端 到 端 路 由 呢 ? 我 们 现在 请 你 亲手 用 一 下 
Traceroute 程序 。 直 接 访 问 站 点 www. traceroute. org， 在 一 个 特定 的 国家 中 选择 一 个 源 ， 踪 
踪 从 这 个 源 到 你 的 计算 机 的 路 由 。( 参 见 1.4 节 有 关 Traceroute 的 讨论 。) 


1.3.2 电路 交换 


通过 网 络 链 路 和 交换 机 移动 数据 有 两 种 基本 方法 : 电路 交换 (circuit switching) 和 分 
组 交换 (packet switching) 。 上 一 节 已 经 讨论 过 分 组 交换 网 络 ， 现 在 我 们 将 注意 力 投 癌 电路 
交换 网 络 。 

在 电路 交换 网 络 中 ， 在 端 系统 间 通信 会 话 期 间 ， 预 留 了 端 系统 间 通 信 沿 路 径 所 需要 的 
资源 (缓存 ， 链 路 传输 速率 ) 。 在 分 组 交换 网 络 中 ， 这 些 资 源 则 不 是 预 留 的 ; 会 话 的 报 文 
按 需 使 用 这 些 资源 ， 其 后 果 可 能 是 不 得 不 等 待 〈 即 排队 ) 接 人 通信 线路 。 一 个 简单 的 类 比 
是 ,考虑 两 家 餐馆， 一 家 需要 顾客 预订 ， 而 另 一 家 不 需要 预订 但 不 保证 能 安排 兢 客 。 对 于 
需要 预订 的 那 家 和 餐馆， 我 们 在 离开 家 之 前 必须 承受 先 打 电话 预订 的 麻烦 。 但 当 我 们 到 达 该 
METH IN JEN Ee THe a vz BY AA RE OP AS iter BETO BY HS ee TE, CA] ASN a DR I TH 
TER, LALA TEAS EE ERE ig HE. AA 

传统 的 电话 网 络 是 电路 交换 网 络 的 例子 。 考 虑 当 一 个 人 通过 电话 网 癌 为 一 个 人 发 送信 
Bo (语音 或 传真 ) 时 所 发 生 的 情况 。 在 发 送 方 能 够 发 送信 息 之 前 ， 该 网 络 必须 在 发 送 方 和 
接收 方 之 间 建 立 一 条 连接 。 这 是 一 个 名 副 其 实 的 连接 ， 因 为 此 时 沿 着 发 送 方 和 接收 方 之 间 
路 径 上 的 交换 机 都 将 为 该 连接 维护 连接 状态 。 用 电话 的 术语 来 说 ， 该 连接 被 称 为 一 条 电路 
(circuit) 。 当 网 络 创 建 这 种 电路 时 ， 它 也 在 连接 期 间 在 该 网 络 链 路 上 预 留 了 恒定 的 传输 速 
K (表示 为 每 条 链 路 传输 容量 的 一 部 分 ) 。 既 然 已 经 为 该 发 送 方 - 接收 方 连接 预 久 了 市 贸 ， 
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则 发 送 方 能 够 以 确保 的 恒定 速率 问 接 收 方 传送 数据 ， 

图 1-13 显示 了 一 个 电路 交换 网 络 。 在 这 个 网 络 中 ， 用 4 条 链 路 互联 了 了 4 台电 路 交换 
BL. 这些 链 路 中 的 每 条 部 有 4 条 电路 ， 因 此 每 条 链 路 能 够 文 持 4 杀 并 行 的 连接 ， 每 台 主 机 
(例如 PC 和 工作 站 ) 者 与 一 台 交 换 机 直 
接 相 连 ， 当 两 台 主 机 要 通信 时 ， 该 网 络 
在 两 台 主 机 之 间 创 建 一 条 专用 的 端 到 端 
连接 (end-to-end connection). KE, € 
HLA 为 了 向 主机 B 发 送 报 文 ， 网 络 必须 
在 两 条 链 路 之 一 上 先 预 留 一 条 电路 。 因 
为 每 条 链 路 具有 4 条 电路 ， 对 于 由 端 到 
疹 连 接 所 使 用 的 每 条 链 路 而 言 ， 该 连接 
在 连接 期 间 获 得 链 路 审 宽 的 1/4 部 分 。 
例如 ， 如 果 两 台 邻 近 交 换 机 之 间 每 条 链 
路 具有 1Mbps 传输 速率 ， 则 每 个 端 到 新 





电路 交换 连接 获得 250kbps 专用 的 传输 图 1-13 由 4 台 交 换 机 和 4 条 链 路 组 成 的 
whee -个 简单 电路 交换 网 络 


1. 电路 交换 网 络 中 的 复 用 

链 路 中 的 电路 是 通过 频 分 复 用 ( Frequency- Division Multiplexing, FDM) 或 时 分 复 用 
( Time- Division Multiplexing, TDM) 来 实现 的 。 对 于 FDM， 链 路 的 频谱 由 路 越 链 路 创建 的 
所 有 连接 所 共享 。 特 别 是 ， 在 连接 期 间 链 路 为 每 条 连接 专用 一 个 频段 ， 在 电话 网 络 中 ， 这 
个 频段 通常 县 有 4kHz 的 宽度 (BI 4000 赫兹 或 每 秒 4000 il). kE. POLES AY wa HE ER 
为 带宽 (bandwidth). 调频 无 线 电 台 也 使 用 FDM 来 共享 88 ~ 108MHz 的 频谱 ， 其 中 每 个 电 
台 和 被 分 配 一 个 特定 的 频段 . 

对 于 一 条 TDM 链 路 ， 时 间 被 划分 为 固定 区 间 的 帧 ， 并 且 每 帧 又 被 划分 为 固定 数量 的 
EFR. 当 网 络 跨 越 一 条 链 路 创建 一 条 连接 时 ， 网 络 在 每 个 巾 中 为 该 连接 指定 一 个 时 际 。 这 
些 时 际 专 门 由 该 连接 单独 使 用 ， 一 个 时 际 【〔 在 每 个 帧 内 ) 可 用 于 传输 该 连接 的 数据 。 

RI 1-14 显示 了 一 个 文 持 多 达 4 条 电路 的 特定 网 络 链 路 的 FDM 和 TDM- XIF FDM, 其 
频率 域 锌 分 割 为 4 个 频段 ， 每 个 频段 的 市 宽 是 4kHz。 对 于 TDM， 其 时 域 被 分 割 为 帧 ， 在 
每 个 帆 申 有 具有 4 AT, AE TY TDM 帆 中 每 条 电路 被 分 配 相 同 的 专用 时 际 。 对 于 TDM, 
一 条 电路 的 传输 速率 等 于 帧 速 康 乘 以 一 个 时 际 中 的 比特 数量 。 例 如 ， 如 果 链 路 每 秒 传输 
8000 个 帧 ， 每 个 时 际 由 8 个 比特 组 成 ， 则 每 条 电路 的 传输 速率 是 64kbps。 

分 组 交换 的 支持 者 总 是 争 游说 ， 电 路 交换 因为 在 静默 期 (silent period) 专用 电路 空 内 
而 效率 较 低 .例如 ， 打 电话 的 一 个 人 停止 讲话 ， 空 闲 的 网 络 资源 (在 治 该 连接 路 几 的 链 路 
中 的 频段 或 时 际 ) 不 能 被 其 他 进行 中 的 连接 所 使 用 。 作 为 这 些 资 源 被 无 效 利 用 的 为 一 个 例 
于 ， 考 虑 一 名 放射 科 医 师 使 用 电路 交换 网 络 远程 存 取 一 系列 x 射线 图 像 。 该 放射 科 医 师 建 
立 一 条 连接 ， 请求 一 幅 图 像 ， 然 后 判读 该 图 像 ， 然 后 再 请 求 一 幅 新 图 像 。 在 放射 科 医 师 判 
该 网 像 期 间 ， 网 络 资源 分 配给 了 该 连接 但 没有 使 用 《〈 即 被 浪费 了 )。 分 组 交换 的 支持 者 偿 
津津 乐 道 地 指出 ， 创 建 端 到 端 电 路 和 预 留 端 到 端 带 宽 是 复杂 的 ， 需 要 复杂 的 信 令 软件 以 协 
调 泊 疾 到 冰 路 径 的 交换 机 的 操作 . 
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所 有 标 有 “2” 的 时 隙 由 一 个 特定 
的 发 送 方 接收 方 对 所 专用 


图 1-14 对 于 FDM， 每 条 电路 连续 地 得 到 部 分 带宽 。 对 于 TDM， 每 条 电路 在 
定时 间 间隔 EDNER) 中 周期 性 地 得 到 所 有 带宽 


在 结束 讨论 电路 交换 之 前 ， 我 们 讨论 一 个 用 数 7 = 示 的 例子 ， 它 更 能 说 明 问 题 的 实 
mn. SEMEL A 到 主机 B 经 一 个 电路 交换 网 络 需 要 多 长 时 间 发 送 一 个 640 000 比特 的 文 
件 。 假 如 在 该 网 络 中 所 有 和 链 路 使 用 24 时 际 的 TDM， 上 县 有 1.536Mbps 的 比特 速率 。 同 时 假 
定 在 主机 A 能 够 开始 传输 该 文件 之 前 ， 需 要 500ms 创建 一 条 问 到 端 电 路 。 它 需要 多 长 时 间 
4 能 发 送 该 文件 ”每 条 链 路 具有 的 传输 速率 是 1. S36 Mbps/24 = pai 因此 传输 该 文件 高 
要 (640kb)/(64kbps) =10s。 对 于 这 个 10s， 再 加 上 电路 创建 时 间 ， die 10. 5s 发 
送 该 文件 。 值 得 注意 的 是 ， 该 传输 时 间 与 链 路 数量 无 关 : 闪 到 闪电 路 不 管 是 通 os 
还 是 100 条 链 路 ， 传 输 时 间 都 将 是 10s。 (E Ba AY Sg EU oa GE i Gd, FG 1E HE ye, BH Nl 
(47) 

2. 分 组 交换 与 电路 交换 的 对 比 

在 描述 了 电路 交换 和 分 组 交换 之 后 ， 我 们 来 对 比 一 下 这 两 者 。 分 组 交换 的 批评 者 经 党 
争辩 说 ， 分 组 交换 不 适合 实时 服务 (例如 ， 电 话 和 视频 会 议 )， 因 为 它 的 绒 到 端 时 延 是 可 
变 的 和 不 可 预测 的 〈 主 要 是 因为 排队 时 延 的 变动 和 不 可 预测 所 致 ) 。 分 组 交换 的 文 持 者 却 
争辩 道 : 山 它 提供 了 比 电路 交换 更 好 的 带宽 共享 ; CO) 它 比 电路 交换 更 简单 ， 更 有 效 ， 实 现 
成 本 更 低 。 分 组 交换 与 电路 交换 之 争 的 有 趣 讨论 参见 | Molinero- Fernandez 2002 |. #444 If 
言 ， 嫌 餐馆 预订 麻烦 的 人 守 可 要 分 组 交换 而 不 愿意 要 电路 交换 。 

分 组 交换 为 什么 更 有 效 呢 ”我 们 看 一 个 简单 的 例子 。 假 定 多 个 用 户 共享 一 条 1Mbps 链 
tin rede 某 用 户 时 而 以 100kbps 恒定 速率 产生 数据 ， 时 而 
静止 一 一 这 时 用 户 不 产生 数据 。 进一步 假定 该 用 户 仅 有 10% 的 时 间 活 跃 (余下 的 90% 的 
时 间 空 亲 下 来 哆 咖啡 ) ， ie 
如 ， 对 于 电路 交换 的 TDM， 如 打 一 个 1s 的 帧 被 划分 为 10 个 时 际 ， 每 个 时 际 为 100ms， 则 
每 帧 将 为 每 个 用 户 分 配 一 个 时 隙 . 

因此 ， 该 电路 交换 链 路 仅 能 文 持 10 ( =1Mbps/100kbps) 个 并 发 的 用 户 。 对 于 分 组 交 
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换 ， 一 个 特定 用 户 活跃 的 概率 是 0.1 ( 即 10%). WA 35 个 用 户 ， 有 11 或 更 多 个 并 发 
活跃 用 户 的 概率 大 约 是 0. 0004。( 课 后 习题 P8 概述 如 何 得 到 这 个 概率 值 .) 当 有 10 个 或 
更 少 并 发 用 户 (以 概率 0.9996 发 生 ) 时 ， 到 达 的 聚合 数据 率 小 于 或 等 于 该 链 路 的 输出 速 
率 1Mbps。 因此 ， 当 有 10 个 或 更 少 个 活跃 用 户 时 ， 通 过 该 链 路 的 分 组 流 基本 上 没有 时 延 ， 
这 与 电路 交换 的 情况 一 样 。 当 同时 活跃 用 户 超过 10 个 时 ， 则 分 组 的 聚合 到 达 率 超过 该 链 
路 的 输出 容量 ， 则 输出 队列 将 开始 变 长 。 (一 直 增 长 到 聚合 输入 速率 重新 低 于 1Mbps， 此 
后 该 队列 长 度 才 会 减少 。) 因为 在 本 例子 中 同时 活跃 用 户 超 过 10 个 的 概率 极 小 ， 分 组 交换 差 
不 多 总 是 提供 了 与 电路 交换 相同 的 性 能 ， 并 且 允 许 在 用 户 数量 是 其 3 倍 时 情况 也 是 如 此 . 

我 们 现在 考虑 第 二 个 简单 的 例子 。 假 定 有 10 个 用 户 ， 某 个 用 户 突然 产生 1000 个 1000 
比特 的 分 组 ， 而 其 他 用 户 则 保持 静默 ， 不 产生 分 组 。 在 每 帧 具有 10 个 时 际 并 且 每 个 时 际 
包含 1000 比特 的 TDM 电路 交换 情况 下 ,活跃 用 户 仅 能 使 用 每 帧 中 的 一 个 时 际 来 传输 数 
据 ， 而 每 个 帧 中 剩余 的 9 个 时 际 保持 空 闪 。 该 活跃 用 户 传 输 完 所 有 10° 比特 数据 需要 10s 
的 时 间 。 在 分 组 交换 情况 下 ,活跃 用 户 能 够 连续 地 以 1Mbps 的 全 部 链 路 速率 发 送 其 分 组 ， 
因为 没有 其 他 用 户 产生 分 组 与 该 活跃 用 户 的 分 组 进行 复 用 。 在 此 情况 下 ,该 活跃 用 户 的 所 
有 数据 将 在 1s 内 发 送 完毕 。 

上 面 的 例子 从 两 个 方面 表明 了 分 组 交换 的 性 能 能 够 优 于 电路 交换 的 性 能 。 这 些 例子 也 
强调 了 两 种 形式 的 在 多 个 数据 流 之 间 共 至 链 路 传输 速率 的 关键 差 寞 。 电 路 交换 不 考虑 评 
求 ， 而 预先 分 配 了 传输 链 路 的 使 用 ， 这 使 得 已 分 配 而 并 不 需要 的 链 路 时 间 示 被 利用 ,为 一 
方面 ， 分 组 交换 按 需 分 配 链 路 使 用 。 链 路 传输 能 力 将 在 所 有 用 户 之 间 逐 分 组 地 被 共享 ， 这 
些 用 户 有 分 组 需要 在 链 路 上 传输 。 

虽然 分 组 交换 和 电路 交换 在 今天 的 电信 和 网络 中 都 是 普遍 采用 的 方式 ,但 趋势 无 疑 是 朝 
着 分 组 交换 方 加 发展。 甚至 许多 今天 的 电路 交换 电话 网 正在 缓慢 地 加 分 组 交换 迁移 。 特 别 
是 ， 电 话 网 经 常 在 昂贵 的 海外 电话 部 分 使 用 分 组 交换 。 


1.3.3 网 络 的 网 络 


我 们 在 前 面 看 到 ， 端 系统 (PC、 智 能 手机 、Web 服务 器 、 电 子 邮件 服务 硕 等 ) 经 过 
一 个 接 入 ISP 与 因特网 相连 。 该 接 入 ISP 能 够 提供 有 线 或 无 线 连 接 ， 使 用 了 包括 DSL、 电 
缆 、FTTH WiFi 和 蜂窝 等 多 种 接 入 技术 。 值 得 注意 的 是 ， 接 入 ISP 不 必 是 本 地 电信 和 局 或 
电缆 公司 ， 相 反 ， 它 能 够 是 如 大 学 (为 学 生 、 教 职员 工 和 从 业 人 员 提 供 因 特 网 接 入 ) 或 公 
司 (CAREER A) 这 样 的 单位 。 但 为 端 用 户 和 内 容 提 供 商 提供 与 接 入 ISP 的 连接 仅 解 
决 了 连接 难题 中 的 很 小 一 部 分 ， 因 为 因特网 是 由 数 以 亿 计 的 用 户 构 成 的 。 要 解决 这 个 难题 ， 
接 入 ISP 自身 必须 互联 。 通 过 创建 网 络 的 网 络 可 以 做 到 这 一 点 ， 理 解 这 个 短语 是 理解 因特网 
的 关键 。 

年 复 一 年 ， 构 成 因特网 的 “网 络 的 网 络 ” 已 经 演化 成 为 一 个 非常 复杂 的 结构 。 这 种 演 
化 很 大 部 分 是 由 经 济 和 国家 策略 驱动 的 ， 而 不 是 由 性 能 考虑 驱动 的 。 为 了 理解 今天 的 因 特 
网 网 络 结构 ， 我 们 来 逐步 递 进 建造 一 系列 网 络 结构 ， 其 中 的 每 个 新 结构 都 更 好 地 接近 我 们 
现 有 的 复杂 因特网 。 回 顾 前 面 互联 接 入 ISP 的 目标 ， 是 使 所 有 端 系统 能 够 彼此 发 送 分 组 
一 种 幼稚 的 方法 是 使 每 个 接 入 ISP 直接 与 每 个 其 他 接 人 ISP 连接 ， 当 然 ， 这 样 的 网 状 设 计 
对 于 接 入 ISP 费用 太 高 ， 因 为 这 将 要 求 每 个 接 人 ISP 与 世界 上 数 十 万 个 其 他 接 人 ISP 有 一 
条 单独 的 通信 链 路 。 
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我 们 的 第 一 个 网 络 结构 即 网 络 结 构 1， 用 单一 的 全 球 承 载 ISP 互联 所 有 接 入 ISP。 我 们 
假想 的 全 球 承 载 ISP 是 一 个 由 路 由 融和 通信 和 链 路 构成 的 网 络 ， 该 网 络 不 仅 跨 越 全 球 ， 而 且 
至 少 具有 一 个 路 由 器 靠近 数 十 万 接 人 ISP 中 的 每 一 个 。 当 然 ， 对 于 全 球 承 载 ISP， 建 造 这 
样 一 个 大 规模 的 网 络 将 耗资 巨大 .为 了 有 利 可 图 ， 自 然 要 向 每 个 连 : 接 的 接 入 ISP 收费 ， 其 
价格 反映 (并 不 一 定 正比 于 ) 一 个 接 入 ISP 经 过 全 球 ISP 交换 的 流量 大 小 。 因 为 接 入 ISP 
[a] SHR RAR ISP 付费 ， 故 接 人 ISP 被 认为 是 客户 (customer)， 而 全 球 承 载 ISP 被 认为 是 提 
供 商 (provider)， 

如 果 某 个 公司 建立 并 运行 了 一 个 可 说 利 的 全 球 承 载 SP， 其 他 公司 建立 目 己 的 全 球 承 
载 ISP 并 与 最 初 的 全 球 承 载 ISP 竞争 则 是 一 件 目 然 的 事 。 这 导致 了 了 网络 结 构 2， 它 由 数 十 
万 接 人 ISP 和 多 个 全 球 承 载 ISP 组 成 。 接 入 ISP 无 疑 喜欢 网 络 结构 2 eat eK 网 络 结构 1 ， 
因为 它们 现在 能 够 根据 价格 和 服务 的 吨 数 ， 在 多 个 苋 i PAI PERR AR Pe PS S Z EJ EI T E FE. 
然而 ， 值 得 注意 的 是 ， 这 些 全 球 承 载 ISP 之 间 必 须 是 互联 的 : 不 然 的 话 ， 与 某 个 全 球 承 载 
ISP 连接 的 接 入 ISP 将 不 能 与 连接 到 其 他 全 球 承 载 ISP P 的 接 入 ISP 通信 ， 

刚才 描述 的 网 络 结 构 2 是 一 种 两 层 的 等 级 结构 ， 其 中 全 球 承 载 提 供 商 位 于 顶层， 而 接 
入 ISP 位 于 底层 。 这 假设 了 全 球 承 载 ISP 不 仅 能 够 接近 每 个 接 人 ISP， 而 且 发 现 经 济 上 也 
PRAH. MEP, ME E ISP LRA SARR RAER m, 并且 确 实 直接 与 
许多 接 和 人 ISP 连接 ， 但 世界 上 没有 JISP 是 存在 于 每 个 城市 中 的 。 相 反 ， 在 任何 给 定 的 区 域 ， 
可 能 有 一 个 区 域 ISP (reginal ISP) ， 区 域 中 的 接 入 ISP 与 之 连接 。 每 个 区 域 ISP 则 与 第 一 
FR ISP (tier-1 ISP) 连接 。 第 一 层 IP 类 似 于 我 们 假想 的 全 球 承 载 ISP; 尽管 第 一 层 ISP 不 


是 在 世界 上 每 个 城市 中 都 存在 ， 但 它 确实 存在 。 有 大 约 十 几 个 第 一 层 ISP， 包 括 Level 3 通 
信 、AT&T、Sprint 和 NTT。 有 趣 的 是 ， 没 有 组 织 正式 认可 第 一 层 状态 。 俗 话说 : 如 果 必 须 


问 你 是 否 是 一 个 组 织 的 成 员 ， 你 可 能 不 是 . 

返回 到 网 络 的 网 络 ， 不 仅 有 多 个 竞争 的 第 一 层 SP， 而 且 在 一 个 区 域 可 能 有 多 个 竞争 的 
XK ISP, 在 这 样 的 等 级 结构 中 ， 每 个 接 人 ISP 向 区 域 ISP 文 付 其 连接 费用 ， 并 且 每 个 区 域 
ISP 回 它 连接 的 第 一 层 ISP 文 付费 用 。 (一 个 接 和 人 ISP 也 能 直接 与 第 一 层 ISP 连接 ， 这 样 它 就 
向 第 一 层 ISP 付费 .) 因此 , 在 这 个 等 级 结构 的 每 层 ， 有 客户 -提供 商 关 系 。 值 得 注意 的 是 ， 
第 一 层 ISP 不 向 任何 人 付费 ， 因 为 它们 位 于 该 等 级 结 oe 使 事情 更 为 复杂 的 是 ， 在 某 
些 区 域 ， 可 能 有 较 大 的 区 域 ISP (可 能 跨越 整个 国家 ) ， 区 域 中 较 小 的 区 域 ISP 与 之 相连 ， 较 
大 的 区 域 ISP 则 与 第 一 层 ISP 连接 。 例 如 ， 在 中 国 ， eia ISP， 它 们 与 省 级 ISP 连 
接 ， 省 级 IP 又 与 国家 级 ISP 连接 ， 国 家 级 ISP 最 终 与 第 一 层 ISP 连接 [Tian 2012 | 。 这 个 多 

层 等 级 结构 仍然 仅仅 是 今天 因特网 的 粗略 近似 ， 我 们 称 它 为 网 络 结构 3。 

为 了 建造 一 个 与 今天 因特网 更 为 相似 的 网 络 ， 我 们 必须 在 等 级 结构 的 网 络 绪 构 3 上 增 
加 存在 点 (Point of Presence，PoP) 、 多 特 、 对 等 和 因特网 交换 点 (Internet exchange point, 
IXP). PoP 存在 于 等 级 结构 的 所 有 层次 ， 但 底层 (RA ISP) 等 级 除外 。 一 个 PoP 只 是 提 
供 商 网 络 中 的 一 台 或 多 人 台 路 由 天 (在 相同 位 置 ) 群 组 ， 其 中 客户 ISP 能 够 与 提供 商 ISP 连 
接 。 对 于 要 与 提供 商 PoP 连接 的 客户 网 络 ， 它 能 从 第 三 方 通信 提供 商 租 用 高 速 链 路 和 卫 接 将 
它 的 路 由 融 之 一 连接 到 位 于 该 PoP 的 一 台 路 由 带 。 任 何 ISP (除了 第 一 层 ISP) 可 以 选择 
为 多 宿 (multi-home) ， 即 可 以 与 两 个 或 更 多 提供 商 ISP 连接 。 例 如 ， 一 个 接 入 ISP 可 能 与 
两 个 区 域 ISP 多 宿 ， 或 者 可 以 与 两 个 区 域 ISP 多 宿 ， 也 可 以 与 多 个 第 一 层 ISP 多 宿 。 当 一 
个 ISP 多 答 时 ， 即 使 它 的 提供 商 之 一 出 现 故障 ， 它 仍然 能 够 继续 发 送 和 接收 分 组 。 
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正如 我 们 刚才 学 习 的 ， 客 户 ISP 向 它们 的 提供 商 ISP 付费 以 获得 全 球 因特网 互联 能 力 
客户 JSP 支付 给 提供 商 ISP 的 费用 数额 反映 了 它 通过 提供 商 交 换 的 流量 为 了 减少 这 些 费 
用 ， 位 于 相同 等 级 结构 层次 的 邻近 一 对 ISP 能 够 对 等 (peer)， 这 就 是 说 ， 能 够 耳 接 将 和 
们 的 网 络 连 到 一 起 ， 使 它们 之 间 的 所 有 流量 经 直接 连接 而 不 是 通过 Livery Pla] ISP 传输 ， 
当 两 个 ISP 对 等 时 ， 通 常 不 进行 结算 ， 即 任 一 个 ISP 不 同 其 对 等 付费 ， 如 前 面 提 到 的 那样 ， 
第 一 层 ISP 也 与 另 一 个 第 一 层 ISP 对 等 ， 它 们 之 间 无 结算 。 对 于 对 等 和 客户 - 提供 商 关 系 
可 读 性 的 讨论 ， 参 见 [Van der Berg 2008 | 。 沿 着 这 些 相同 路 线 ， 第 三 方 公司 创建 一 个 因 特 
网 交换 点 (Internet Exchange Point, IXP) (通常 在 一 个 有 自己 的 交换 机 的 独立 建筑 物 中 )， 
IXP 是 一 个 汇合 点 ， 多 个 ISP 能 够 在 这 里 共同 对 等 。 在 今天 的 因特网 中 有 大 约 300 个 IXP 
| Augustin 2009 ] 。 我 们 称 这 个 系统 为 生态 系统 一 一 由 接 入 ISP, Xh ISP、 第 一 层 JSP、 
PoP, Zii. HS ee 

我 们 现在 最 终 到 达 了 网 络 结构 5， 它 描述 了 2012 年 的 因特网 。 在 图 1-15 中 显示 了 了 网络 
结构 3， 它 通过 在 网 络 结构 4 a 川内 容 提供 商 网 络 (content provider network) 构建 而 成 . 
谷歌 是 当前 这 样 的 内 容 提供 商 网络 的 一 个 突出 例子 .在 本 书写 作 之 时 ， 谷 歌 估 计 有 30 ~50 个 
数据 中 心 部 署 在 北美 、 欧 洲 、 亚 洲 、 南 美和 澳大利亚 。 其 中 的 某 些 数据 中 心 容 纳 了 超过 十 万 
台 的 服务 器 ， 而 另 一 些 数据 中 心 则 较 小 ， 仅 容纳 数 百 台 服 务 吉 .谷歌 数据 中 心 都 经 过 专用 的 
TCP/IP 网 络 互 联 ， 该 网 络 跨 越 全 球 ， 但 仍然 独立 于 公共 因特网 .重要 的 是 ,谷歌 专 用 网 络 
仅 承载 出 人 谷歌 服务 器 主机 的 流量 。 如 图 1-15 所 示 ， 和 谷歌 专用 网 络 通过 与 较 低 层 ISP 对 等 

无 结算 ) 尝试 “ 绕 过 ”因特网 的 较 高 层 ， 采 用 的 方式 可 以 是 直接 与 它们 连接 ， 或 者 在 IXP 
处 与 它们 连接 [Labovitz 2010]。 然 而 ， 因 为 许多 接 人 ISP 通过 第 一 层 网 络 的 承载 仍 能 到 达 ， 
所 以 谷歌 网 络 也 与 第 一 层 ISP 连接 ， 并 就 与 它们 交换 的 流量 向 这 些 ISP 付费 。 通 过 创建 自己 
的 网 络 ， 内 容 提 供 商 不 仅 减 少 了 回 项 层 ISP 支付 的 费用 ， 而 且 对 其 服务 最 终 如 何 交 付 给 端 用 
户 有 了 更 多 的 控制 。 谷歌 的 网 络 基础 设施 在 7.2.4 节 中 进行 了 详细 描述 . 
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图 1-15 ISP 的 互联 


总 结 一 下 ， 今 天 的 因特网 是 一 个 网 络 的 网 络 ， 其 结构 复杂 ， 由 十 多 个 第 一 层 ISP 和 数 
十 万 个 较 低 层 ISP 组 成 。ISP 覆盖 的 区 域 有 所 不 同 ， 有 些 跨 越 多 个 大 洲 和 大 洋 ， 有 些 限于 
很 小 的 地 理 区 域 。 较 低层 的 ISP 与 较 高 层 的 ISP 相连 ， 较 高 层 ISP P RIGAR: 用 户 和 内 容 
提供 商 是 较 低 层 ISP 的 客户 ， 较 低层 ISP 是 较 高 层 ISP 的 客户 . 近年 来 ， 主 要 的 内 容 提供 
商 也 已 经 创建 自己 的 网 络 ， 直 接 在 可 能 的 地 方 与 较 低 层 ISP 互联 。 
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1.4 分 组 交换 网 中 的 时 延 、 丢 包 和 吞吐 量 


回想 在 1.1 节 中 我 们 讲 过 ， 因 特 网 能 够 看 成 是 一 种 为 运行 在 端 系 统 上 分 布 式 应 用 提 
供 服 务 的 基础 设施 ”在 理想 情况 下 ， 我 们 希望 因特网 服务 能 够 在 任意 两 个 病 系 统 之 问 了 瞬间 
移动 我 们 想 要 的 大 量 数据 而 没有 任何 数据 丢失 然而 ， 这 是 一 个 极 高 的 目标 ， 实 践 中 难以 
达到 - 与 之 相反 ， 计 算 机 网 络 必定 要 限制 在 端 系统 之 间 的 存 吐 量 (每 秒 能 够 传送 的 数据 
旺 ) ， 在 靖 系 统 之 间 引 入 时 延 ， 而 且 实 际 上 能 够 丢失 分 组 . 一 方面 ， 现 实 世 界 的 物理 定律 
"| 入 的 时 延 天 包 并 限制 在 吐 量 是 不 全 的 。 而 男 一 方面 ， 因 为 计算 机 网 络 存在 这 些 问 题 ， 
于 比如 何 去 处 理 这 些 问 题 有 许多 令 人 着 迷 的 话题 ， 多 得 足以 开设 一 门 有 关 计 算 机 网 络 方面 
的 球 程 ， 可 以 做 上 千 箭 博士 论文 ! 在 本 市 中 ， 我 们 将 开始 人 研究 和 量化 计算 机 网 络 中 的 时 
WE, FL AAP Ph ae fo] A 


1.4.1 分 组 交换 网 中 的 时 延 概 述 


前 耐 讲 过 ， 分 组 从 一 从 = HL (W) 出 发 ， -系列 路 由 带 人 传输， 在 另 一 台 主 机 
(目的 地 ) 中 结束 它 的 历程 。 当 分 组 从 一 个 结 ( pene +) WARA RIE 到 后 
点 (主机 或 路 用 器 ) ， 该 分 组 在 沿途 的 每 个 结 点 经 受 了 几 种 不 同类 型 的 时 延 这 些 时 延 最 
为 重要 的 是 结 点 处 理 时 延 (nodal processing delay) 、 RFEA Mi (queuing delay) 、 传 输 时 延 
(transmission delay) 和 传播 时 延 (propagation delay) ， 这 些 时 延 总 体 轩 加 起 来 是 结 点 总 时 
HE (total nodal delay ) ， 许 多 因特网 应 用 ， 如 搜索 、Web 浏览 、 电 子 邮 件 、 地 图 、 即 时 讯 
明和 IP ier, 它们 的 性 能 受 网 络 时 延 的 影响 部 很 大 。 为 了 深入 理解 分 组 交换 和 计算 机 网 
络 ， 我 们 必须 理解 这 些 时 延 的 性 质 和 重要 性 . 

时 延 的 类 型 

我 们 来 探讨 一 下 图 1-16 环境 中 的 这 些 时 延 。 作 为 源 和 目的 地 之 间 的 端 到 端 路 径 的 一 
部 分 ， 一 个 分 组 从 上 游 re ar A [nee AE B 发 送 。 我们 的 日 标 是 在 路 由 带 A ZI 
WA IE, (EE AY ae, Pe de A HAIE Ar B 的 出 链 路 。 该 链 路 前 面 有 一 个 
队列 〈 也 称 为 缓存 ) 。 当 acai aaa 到 达 路 由 大 ART, BAT ae A 检查 该 分 组 的 首部 
VRE IK IRAE SE. SPRZ F AE. PETA, AAHAS i ER 
是 通 回 路 由 带 B 的 那 条 链 路 。 仅 当 在 该 链 路 没有 其 他 分 组 正在 传输 并 且 没 有 其 他 分 组 排 在 
该 队列 前 面 时 ， 才 能 在 这 条 链 路 上 传输 该 分 组 ; 如 采 该 链 路 当前 正 繁忙 或 有 其 他 分 组 已 经 
在 该 链 路 上 排队 ， 则 新 到 达 的 分 组 则 将 参与 排队 。 





结 点 处 理 。 ”排队 等 待 ” ”传输 
(等 待 传输 ) 





图 1-16 Per ae A 的 结 点 时 延 
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(1) Ab FRAY UE 

or AE PSL ES Pa A EG PK OP ZL Uy Aa Ak Fa hag BEY AY [i] Zee cb BBE BE A — a op, Ah ERY HE 
也 能 包括 其 他 因素 ， 如 检查 比特 级 别 的 差错 所 需要 的 时 间 ， 该 差错 出 现在 从 上 游 结 点 回路 
FH fir A 传输 这 些 分 组 比特 的 过 程 中 。 高 速 路 由 费 的 处 理 时 延 通常 是 微 秒 或 更 低 的 数量 级 
在 这 种 结 点 处 理 之 后 ， 路 由 需 将 该 分 组 引 回 通 往 路 由 咒 B 链 路 之 前 的 队列 。( 在 第 4 章 中 ， 
我 们 将 研究 路 由 天 运 行 的 细节 。-) 

(2) 排队 时 延 

在 队列 中 ， 当 分 组 在 链 路 上 每 待 传输 时 ， 它 经 受 排队 时 延 。 一 个 特定 分 组 的 排队 时 延 
长 度 将 取决 于 先期 到 达 的 正在 排队 等 待 问 链 路 传输 的 分 组 数量 。 如 果 该 队列 是 空 的 ， 并 且 
当前 没有 其 他 分 组 正在 传输 ， 则 该 分 组 的 排队 时 延 为 0。 另 一 方面 ， 如 果 流 量 很 大 ， 并 且 
许多 其 他 分 组 也 在 等 竺 传输， 该 排队 时 延 将 很 长 。 我 们 将 很 快 看 到 ， 到 达 分 组 期 待 发现 的 
分 组 数量 是 到 达 该 队列 的 流量 的 强度 和 性 质 的 函数 。 实 际 的 排队 时 延 可 以 是 毫秒 到 微 秒 
量 级 。 

(3) 传输 时 延 

假定 分 组 以 先 到 先 服务 方式 传输 ， 这 在 分 组 交换 网 中 是 常见 的 方式 ， 仅 当 所 有 已 经 到 
达 的 分 组 被 传输 后 ， 才 能 传输 刚 到 达 的 分 组 。 用 上 比特 表示 该 分 组 的 长 度 ， 用 R bps ( 即 
b/s) ean Maer dh A FIR ae B 的 链 路 传输 速率 。 例 如 ， 对 于 一 条 10Mbps 的 以 太 网 链 
路 ， 速 率 R=10Mbps; 对 于 100Mbps 的 以 太 网 链 路 ， 速 率 尺 = 100Mbps。 传 输 时 延 是 L/R 
这 是 将 所 有 分 组 的 比特 推 (传输 ) 回 链 路 所 需要 的 时 间 ， 实 际 的 传输 时 延 通常 在 毫秒 到 微 
秒 量 级 。 

(4) 传播 时 延 

一 旦 一 个 比特 被 推 问 链 路 ， 该 比特 需要 回路 由 需 B 传播 。 从 该 链 路 的 起 点 到 路 由 器 B 
传播 所 需要 的 时 间 是 传播 时 延 。 该 比特 以 该 链 路 的 传播 速率 传播 。 该 传播 速率 取决 于 该 链 
路 的 物理 媒体 ( 即 光 纤 、 双 绞 铜 线 等 )， 其 速率 范围 是 2 x10 ~3 x10 "m/s， 这 等 于 或 略 小 
于 光速 。 该 传播 时 延 等 于 两 台 路 由 带 之 间 的 距离 除 以 传播 速率 。 即 传播 时 延 是 4/s， 其 中 
d 是 路 由 器 A 和 路 由 器 B 之 间 的 距离 ，s 是 该 链 路 的 传播 速率 。 一 旦 该 分 组 的 最 后 一 个 比 
特 传播 到 结 点 B， 该 比特 及 前 面 的 所 有 比特 被 存储 于 路 由 需 B。 整 个 过 程 将 随 着 路 由 器 B 
执行 转发 而 持续 下 去 。 在 广域网 中 ,传播 时 延 为 毫秒 量 级 . 

(5) 传输 时 延 和 传播 时 延 的 比较 

计算 机 网 络 领 域 的 新 手 有 时 难以 理解 传输 时 延 和 传播 时 延 之 间 的 差异 。 该 差异 是 微妙 
而 重要 的 。 传 输 时 延 是 路 由 器 将 分 组 推出 所 需要 的 时 间 ， 它 是 分 组 长 度 和 链 路 传输 速率 的 
了 呐 数 ， 而 与 两 台 路 由 融 之 间 的 距离 无 关 。 男 一 方面 ， 传 播 时 延 是 一 个 比特 从 一 台 路 由 器 问 
另 一 台 路 由 需 传 播 所 需要 的 时 间 ， 它 是 两 台 路 由 郑 之 间距 离 的 男 数 ， 而 与 分 组 长 度 或 链 路 
传输 速率 无 天 。 

一 个 类 比 可 以 阐明 传输 时 延 和 传播 时 延 的 概念 。 考 虑 一 条 公路 每 100km 有 一 个 收费 
站 ， 如 图 1-17 所 示 。 可 认为 收费 站 间 的 公路 段 是 链 路 ， 收 费 站 是 路 由 器 。 假 定 汽车 以 
100km/h 的 速度 在 该 公路 上 行驶 ( 即 传播 ) ( 即 当 一 辆 汽车 离开 一 个 收费 站 时 ， 它 立即 加 
速 到 100km/h 并 在 收费 站 间 维 持 该 速度 ) 。 假 定 这 时 有 10 辆 汽车 的 车 队 在 行驶 ， 并 且 这 
10 辆 汽车 以 固定 的 顺序 互相 跟随 。 可 以 认为 每 辆 汽车 是 一 个 比特 ， 该 车 队 是 一 个 分 组 。 
同时 假定 每 个 收费 站 以 每 辆 车 12s 的 速度 服务 〈( 即 传输 ) 一 辆 汽车 ， 由 于 时 间 是 深夜 ， 因 
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此 该 车 队 是 公路 上 唯一 一 批 汽 车 。 最后， 假定 无 论 该 车 队 的 第 一 辆 汽车 何 时 到 达 收 费 站 ， 
ERA ASS. 直到 其 他 9 辆 汽车 到 达 并 整 队 依次 前 行 。( 因 此， 整个 车 队 在 它 能 够 
“转发 ”之 前 ， 必 须 存储 在 收费 站 。) 收费 站 将 整个 车 队 推 问 公 路 所 需要 的 时 间 是 (10 辆 
千 )A(5 辆 车 /min) =2min。 该 时 间 类 上 比 于 一 人 台 路 由 需 中 的 传输 时 延 。 因 此 ， 一 辆 汽车 从 一 
个 收费 站 出 口 行驶 到 下 一 个 收费 站 所 需要 的 时 间 是 100h/(100km/h) = 1h。 这 个 时 间 类 比 
FF 传播 时 延 ， 畴 此， 从 该 车 队 存 储 在 收费 站 前 到 该 车 队 存 储 在 下 一 个 收费 站 前 的 时 间 是 
“传输 时 延 ” 和 “传播 时 间 ” 总 和 ， 在 本 例 中 为 62min, 








faima 
10 辆 汽车 的 车 队 


图 1-17 车 队 的 类 比 


我 们 更 深入 地 探讨 一 下 这 个 类 比 。 如果 收 费 站 对 车 队 的 服务 时 间 大 于 汽车 在 收费 站 之 
逆行 驶 的 时 间 ， 将 会 发 生 什 么 情况 呢 ? 例如 ， 假 定 现在 汽车 是 以 1000km/h 的 速率 行驶 ， 
收费 站 是 以 每 分 钟 一 辆 汽车 的 速率 为 汽车 服务 。 则 汽车 在 两 个 收费 站 之 间 的 行驶 时 延 是 
6min， 收 费 站 为 车 队 服 务 的 时 间 是 10min。 在 此 情况 下 ， 在 该 车 队 中 的 最 后 几 辆 汽车 离开 
第 一 个 收费 站 之 前 ， 该 车 队 中 前 面 的 几 辆 汽车 将 会 达到 第 二 个 收费 站 。 这 种 情况 在 分 组 交 
换 网 中 也 会 发 生 ， 一 个 分 组 中 的 前 几 个 比特 到 达 了 一 人 台 路 由 器 ， 而 该 分 组 中 许多 余下 的 比 
特 仍然 在 前 面 的 路 由 天 中 等 竺 传输 。 

如 果 说 一 网 胜 千 言 的 话 ， 则 一 个 动画 必定 胜 百 万 言 。 与 本 书 配套 的 Web 网 站 提供 了 
-个 交互 式 Java 小 程序 ， 它 很 好 地 展现 及 对 比 了 传输 时 延 和 传播 时 延 。 我 们 极力 推荐 读者 
访问 该 Java 小 程序 。[ Smith 2009] 也 提供 了 可 读 性 很 好 的 有 关 传 播 、 排 队 和 传输 时 延 的 
讨论 。 

如 果 我 们 令 di 、d ds 和 ds 分 别 表 示 处 理 时 延 、 排 队 时 延 、 传 输 时 延 和 传播 
时 延 ， 则 结 点 的 总 时 延 由 下 式 给 定 : 

本 

这 些 时 延 成 分 所 起 的 作用 可 能 变化 很 大 。 例如 ，d,,,, 对 于 连接 两 台 位 于 同一 个 大 学 校 
园 的 路 由 下 的 链 路 而 言 可 能 是 微不足道 的 〈 例 如 ， 几 个 微 秒 ) ; 然而 ，d,,,. 对 于 由 同步 卫 
E EPR AUK I PR ee OR UE ILA ER, HEME ROA dooa PAY EBS KMH, dian AY 
影响 能 够 是 微不足道 的 ， 也 能 是 很 大 的 。 它 的 影响 通常 对 于 LOMbps 和 更 高 的 传输 速率 
(例如 ， 对 于 LAN) 的 信道 而 言 是 微不足道 的 ; 然而 ， 对 于 通过 低速 拨号 调制 解 调 需 链 路 
发 送 的 长 因特网 分 组 而 言 ， 可 能 是 数 百 毫 秒 。 处 理 时 延 ,通常 是 微不足道 的 ; 然而 ， 它 
对 一 人 台 路 由 需 的 最 大 吞吐 量 有 重要 影响 ， 最 大 吞吐 量 是 一 台 路 由 器 能 够 转发 分 组 的 最 大 


1.4.2 排队 时 延 和 丢 包 


结 点 时 延 的 最 为 复杂 和 有 趣 的 成 分 是 排队 时 延 d,,,,.。 事 实 上 ， 排 队 时 延 在 计算 机 网 络 
中 的 重要 程度 及 人 们 对 它 感 兴趣 的 程度 ， 从 发 表 的 数 以 千 计 的 论文 和 大 量 专著 的 情况 可 见 
— HE | Bersekas 1991; Daigle 1991; Kleinrock 1975, 1976; Ross 1995 | 。 我 们 这 里 仅 给 出 
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有 关 排 队 时 延 的 总 体 的 、 直 和 觉 的 讨论 ; 求知 欲 强 的 读者 可 能 要 浏览 某 些 书籍 (或 者 最 终 与 
有 关 这 方面 的 博士 论文 ), 与 其 他 3 项 时 延 CBM dS dian Al dy.) 不 同 的 是 ， 排 队 时 延 对 
不 同 的 分 组 可 能 是 不 同 的 例如， 如 果 10 个 分 组 同时 到 达 空 队列 ， 传 输 的 第 一 个 分 组 没 
有 排队 时 延 ， 而 传输 的 最 后 一 个 分 组 将 经 受 相 对 大 的 排队 时 延 CR eet a 
组 被 传输 )。 因此 ， 当 表征 排队 时 延 时 ， 人 们 通常 使 用 统计 量 测 度 ， 如 平均 排队 时 延 、 排 
队 时 延 的 方差 和 排队 时 延 超过 革 些 特定 值 的 概率 - 

什么 时 候 排 队 时 延 大 ， 什 么 时 候 又 不 大 呢 ? 该 问题 的 答案 很 大 程度 取决 于 流量 旬 达 该 
队列 的 速率 、 链 路 的 传输 速率 和 到 达 度 量 的 性 质 ， 即 流量 是 周期 性 到 达 还 是 ae 
A. 为 了 更 深入 地 领会 某 些 要 点 ,， 令 a 表示 分 组 到 达 队 列 的 平均 速率 (a 的 单位 是 分 组 
秒 ， 即 pktAs)， 前 面 讲 过 RR 是 传输 速率 ， 即 从 队列 中 推出 比特 的 速率 (以 bps 即 b/s ho 
位 ) ， 为 了 简单 起 见 、 BGEA HAE L 比特 组 成 的 。 则 比特 到 达 队 列 的 平均 速率 
是 La bps ， 最 后 ， 假 定 该 队列 非常 大 ， 因 此 它 基 本 能 容纳 无 限 数 量 的 比特 。 比 率 La/R 被 
称 为 流量 强度 (traffic intensity ) ， 它 在 估计 排 队 时 延 的 范围 方面 经 党 起 着 重要 的 作用 。 如 
果 Au/R>1， 则 比特 到 达 队 列 的 平均 速率 超过 从 该 队列 传输 出 去 的 速率 。 在 这 种 不 全 的 情 
况 下 ， 该 队列 趋向 于 无 界 增加 ， 并 且 排 队 时 延 将 趋向 无 穷 大 ! 因此 , 流量 工程 中 的 一 条 金 
科 玉 律 是 : 设计 系统 时 流量 强度 不 能 大 于 1.。 

现在 考虑 La/R<1 时 的 情况 ， 这 时 ， 到 达 流 量 的 性 质 影响 排队 时 延 . 例如 ， 如 采 分 组 
周期 性 到 达 ， 即 每 L/R 秒 到 达 一 个 分 组 ， 则 每 个 分 组 将 到 达 一 个 空 队 列 中 ,不 会 有 排队 时 
延 。 在 男 一 方面 ， 如 果 分 组 以 突 发 形 ni 而 不 是 周期 性 到 达 ， 则 有 很 大 的 平均 排队 时 
征 ， 例 如 ， 假 定 每 (LXR)N 秒 同 时 到 达 A 个 分 组 . 则 传输 的 第 一 个 分 组 没有 排队 时 延 ; 
传输 的 第 二 个 分 组 就 有 L/R baka ee 第 nn 个 传输 的 分 组 具有 (n-1) 
L/R 秒 的 排队 时 延 。 我 们 将 该 例子 中 的 计算 平均 排队 时 延 的 问题 留 给 读者 作为 练习 . 

以 上 描述 周期 性 到 达 的 两 个 例子 有 些 学 术 味 。 到 达 队 列 的 过 程 通常 是 随机 的 ， 即 到 达 
并 不 遵循 任何 模式 ， 分 组 之 间 的 时 间 间 隔 是 随机 的 。 在 这 种 更 为 真实 的 情况 下 ， 量 La/R 
通常 不 足以 全 面 地 表征 时 延 的 统计 量 。 不 过 ， 直 观 地 理解 排队 时 延 的 范围 很 有 用 。 特 别 
是 ， 如 果 流 量 强度 接近 于 0， 则 几乎 没有 分 组 到 达 并 且 到 达 间 隅 很 大 、 那 么 到 达 的 分 组 将 
不 可 能 在 队列 中 发 现 别 的 分 组 。 因 此 ,平均 排队 时 延 将 接近 0。 在 另 一 方面 ， 当 流量 强度 
接近 1 时 ， 将 存在 到 达 率 超过 传输 能 力 的 时 间 间 隔 〈 申 于 分 组 到 达 率 的 波动 ) ， 在 这 些 时 
段 中 将 形成 队列 : 无 论 如 何 ， 随 着 流量 强度 接近 1 
平均 排队 长 度 变 得 越 来 越 长 . 平均 排队 时 延 与 流量 强 
度 的 定性 关系 如 图 1-18 所 示 

图 1-18 的 一 个 重要 方面 是 这 样 一 个 事实 : 随 着 
流量 强度 接近 于 1， 平均 排队 时 延 迅 速 增加 。 TORE 
少量 的 增加 将 导致 时 延 大 得 多 的 增加 。 也 许 你 在 公路 
上 经 ee Qn SR ZS Be TE aH FF TH EY ZS BE 
Ih, RRA ES A EY it tat eB PE SE 
FI, tbe 
流量 ， 经 受 的 时 延 就 可 能 很 大 。 LaiR 

为 了 真实 地 感受 一 下 排队 时 延 的 情况 ， 我 们 再 次 图 1-18 平均 排队 时 延 与 
鼓励 你 访问 本 书 的 Web 网 站 ， 该 网 站 提供 了 一 个 有 流量 强度 的 关系 


平均 排队 时 延 
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ee Java 小 程序 ， 如 有 果 你 将 分 组 到 达 率 设置 得 足够 大 ， 使 流量 吗 度 超过 1， 那 
么 将 看 到 经 过 一 段 时 间 后 ， 队 列 慢 慢 地 建立 起 来 ; 


在 上 述 讨 论 中 .我 们 已 经 假设 队列 能 够 容纳 无 穷 多 的 分 组 .在 现实 中 、 一 条 链 路 前 的 
队列 只 有 有 限 的 容量 ， 尽 管 排 队 容 量 极 大 地 依赖 于 路 由 硕 设 计 和 成 本 因为 该 排队 容量 是 
有 限 的 ， 随 着 流量 强度 接近 1， 排队 时 延 并 不 实际 趋向 无 穷 大 相反， 到 达 的 分 组 将 发 现 
一 个 满 的 队列 由 于 没有 地 方 存储 这 个 ， TH. POH AEF (drop) 该 分 组 ， 即 该 分 组 将 
会 丢失 (1ost)。， 当 流量 强度 大 于 1 时， 队列 中 的 这 种 溢出 也 能 人 够 在 用 于 队列 的 Java 小 程序 


中 看 到 |. 
从 端 系统 的 角度 看 ， 上 述 丢 包 现象 看 起 来 是 一 个 分 组 已 经 传输 到 网 络 核心 ， 但 它 绝 不 
会 从 网 络 发 送 到 目的 地 。 分 组 丢失 的 份额 随 着 流量 强度 增加 而 增加 。 因 此 ， 一 个 结 点 的 性 


能 常常 不 仅 根 据 时 延 来 度量 ， 而 且 根 据 分 组 丢失 的 概率 来 度量 。 正 如 我 们 将 在 后 面 各 曹 中 
讨论 的 那样 ， 于 失 的 分 组 可 能 基于 端 到 端的 原则 重 传 ， 以 确保 所 有 的 数据 最 终 从 源 传 送 到 
了 日 的 地 。 


1.4.3 端 到 端 时 延 


前 面 的 讨论 一 直 集 中 在 结 点 时 延 上 ， 即 在 单 台 路 巾 融 上 的 时 延 - 我 们 现在 考虑 从 源 到 
目的 地 的 总 时 延 。 为 了 能 够 理解 这 个 概念 ， 假 定 在 源 主机 和 目的 主机 之 间 有 AN - 1 RH 
器 。 我 们 还 要 假设 该 网 络 此 时 是 无 拥塞 的 〈 央 此 排队 时 延 是 微不足道 的 )， ha fit 
ANG FEL EY Ab BY HE E do, Baie U E ULAS fo RE R bps， 每 条 链 路 的 传 
播 时 延 是 dd， : 结 点 时 延 累加 起 Me FE Bag E ag AT LE : 


diaa = Nile T han Pad (19) 
式 中 再 次 有 dd ，=LR， 其 中 了 是 分 组 长 度 。 值得 注意 的 是 , A (1-2) ÆA (1-1) 的 一 般 
Hest, sl (1-1) 没有 考虑 处 理 时 延 和 传播 时 延 。 在 各 结 点 5 具有 不 同 的 时 延 和 每 个 结 点 存在 


平均 排队 时 延 的 情况 下 ， 需 要 对 式 (1-2) 进行 一 般 化 处 理 . 我 们 将 有 关 工 作 留 给 读者 。 

1. Traceroute 

为 了 对 计算 机 网 络 中 的 时 延 有 一 个 第 一 手 认 识 ， 我 们 可 以 利用 Traceroute 程序 Trac- 
eroute 是 一 个 简单 的 程序 、 它 能 够 在 任何 因特网 主机 上 运行 。 当 用 户 指 定 一 个 目的 主机 名 
字 时 ， 源 主机 中 的 该 程序 明 着 该 目的 地 发 送 多 个 特殊 的 分 组 当 这 些 分 组 回 着 目的 地 传送 
时 ， 它 们 通过 一 系列 路 由 需 。 当 路 由 融 接收 到 这 些 特 珠 分 组 之 一 时 ， 它 回 源 回 送 一 个 短 报 
X. 该 报 文 包括 该 路 由 需 名 字 和 地 址 . 

更 具体 的 是 ,假定 在 源 和 目的 地 之 间 有 NN-1 台 路 由 硕 。 则 源 将 回 网 络 发 送 N 个 特殊 
的 分 组 ， 其 中 每 个 分 组 地 址 指 回 最 终 目 的 地 - 这 AN 个 特殊 分 组 标识 为 从 1 到 入 ， 第 一 个 分 
组 标识 为 1!， 最 后 的 分 组 标识 为 N。 当 第 n 台 路 由 器 接收 到 标识 为 n 的 第 nn 个 分 组 时 ， 该 
路 由 融 不 是 同 它 的 目的 地 转发 该 分 组 ， 而 是 回 源 回 送 一 个 报 文 。 当 目的 主机 接收 第 N 个 分 
组 时 ， 它 也 会 回 源 返回 一 个 报 文 。 该 源 记 录 了 从 它 发 送 一 个 分 组 到 它 接收 到 对 应 返回 报 文 
所 经 受 的 时 间 ; 它 也 记录 了 返回 该 报 文 的 路 由 堪 〈 或 目的 地 主机 ) 的 名 字 和 地 址 。 以 这 种 
方式 ， 源 能 够 重建 分 组 从 源 到 目的 地 所 采用 的 路 由 ， 并 且 该 源 能 够 决定 到 所 有 中 间 路 由 需 
的 往返 时 延 。Traceroute 实际 上 对 刚才 摘 述 的 实验 重复 了 了 3 次 ， 因 此 该 源 实际 上 向 目的 地 


Kp 


30 





发 送 了 3 xN DAH. RFC 1393 详细 地 描述 了 Traceroute, 

这 里 有 一 个 Traceroute 程序 输出 的 例子 ， 其 中 追踪 的 路 由 从 源 主 机 gaia. cs. umass. edu 
(位 于 马 院 诸 塞 大 学 ) 到 cis. poly. edu (位 于 布鲁克 林 的 理工 大 学 )。 输 出 有 6 列 : 第 一 列 
征 前 面 描述 的 款 值 ， 即 治 着 路 径 上 的 路 由 融 编 号 ; 第 二 列 是 路 由 器 的 名 字 ; 第 三 列 是 路 由 
谷地 址 〈 格 式 为 xxx. xxx. xxx. xxx); 最 后 3 列 是 3 次 实验 的 往返 时 延 。 如 果 源 从 任何 给 定 
的 路 由 带 接 收 到 少 于 3 条 报 文 (由 于 网 络 中 的 丢 包 ) Traceroute 在 该 路 由 器 号 码 后 面 放 一 
个 星 扎 ， 并 癌 那 台 路 由 需 报 告 少 于 3 次 往返 时 间 ， 


$ 
l cs-gw (128.119.240.254) 1.009 ms 0.899 ms 0.993 ms 

2 128.119.3.154 (128.119.3.154) 0.931 ms 0.441 ms 0.651 ms 

3 border4-rt-gi-1-3.gw.umass.edu (128.119.2.194) 1.032 ms 0.484 ms 0.451 ms 

4 acrl-ge-2-1-0.Boston.cw.net (208.172.51.129) 10.006 ms 8.150 ms 8.460 ms 

5 agr4-loopback.NewYork.cw.net (206.24.194.104) 12.272 ms 14.344 ms 13.267 ms 

6 acr2-loopback.NewYork.cw.net (206.24.194.62) 13.225 ms 12.292 ms 12.148 ms 

7 posl0-2.core2.NewYorkl.Level3.net (209.244.160.133) 12.218 ms 11.823 ms 11.793 ms 

8 gige9-1-52.hsipaccess1.NewYorkl.Level3.net (64.159.17.39) 13.081 ms 11.556 ms 13.297 ms 
p0-0.polyu.bbnplanet.net (4.25.109.122) 12.716 ms 13.052 ms 12.786 ms 

10 cis.poly.edu (128.238.32.126) 14.080 ms 13.035 ms 12.802 ms 


在 上 述 跟踪 中 ， 在 源 和 目的 之 间 有 9 a. REP a ee A eT 
有 都 有 地 址 。 例 如 ， 路 由 大 3 的 名 字 是 border4- rt- gi- 1-3. gw. umass.edu， 它 的 地 址 是 
128. 119. 2. 194。 看 看 为 这 人 台 路 由 釉 提 供 的 数据 ， 可 以 看 到 在 源 和 路 由 需 之 间 的 往返 时 延 : 
3 次 试验 中 的 第 一 次 是 1.03ms， 后 继 两 次 试验 的 往返 时 延 是 0.48ms 和 0.45ms。 这 些 往返 
时 延 包 括 刚才 讨论 的 所 有 时 延 ， 即 包括 传输 时 延 、 传 播 时 延 、 路 由 需 处 理 时 延 和 排队 时 
延 。 因 为 该 排队 时 延 随 时 间 变 化 ， 分 组 n 发 送 到 路 由 硕 革 的 往返 时 延 实际 上 能 够 比分 组 
n+l AKER Ae +] 的 往返 时 延 更 长 。 的 确 ， 我 们 在 上 述 例子 中 观察 到 了 这 种 现象 : 
到 路 由 瑚 6 的 时 延 比 到 路 由 部 7 的 更 大 | 

PRH A C WRIA Traceroute 程序 吗 ? 我 们 极力 推荐 你 访问 http://www. traceroute. org, € 
的 Web 界面 提供 了 有 关 路 由 跟 踊 的 广泛 的 源 列表 。 你 选择 一 个 源 ， 并 为 任何 目的 地 提供 
主机 名 ， 该 Traceroute 程序 则 会 完成 所 有 工作 。 有 许多 为 Traceroute 提供 图 形 化 界面 的 免费 
软件 程序 ， 其 中 我 们 喜爱 的 一 个 程序 是 PingPlotter[ PingPlotter 2012 | 

2， 端 系统 、 应 用 程序 和 其 他 时 延 

除了 处 理 时 延 、 传 输 时 延 和 传播 时 延 ， 端 系统 中 还 有 其 他 一 些 重 要 时 延 。 例如， 作为 
它 的 协议 的 一 部 分 ， 硕 望 同 共享 媒体 〈 例 如 在 Wiki 或 电缆 调制 解 调 需 情况 下 ) 传输 分 组 
的 痪 系统 可 以 有 意 地 延迟 它 的 传输 以 与 其 他 端 系统 共享 媒体 ; 我 们 将 在 第 5 章 中 详细 地 考 
虑 这 样 的 一 些 协 以 。 为 一 个 重要 的 时 延 是 媒体 分 组 化 时 延 ， 这 种 时 延 出 现在 经 IP 语音 
(VoIP) 应 用 中 。 在 VoIP 中 ， 发 送 方 在 回 因特网 传递 分 组 之 前 必须 首先 用 编码 的 数字 化 语 
音 填充 一 个 分 组 。 这 种 填充 一 个 分 组 的 时 间 称 为 分 组 化 时 延 ， 它 可 能 较 大 ， 并 能 够 影响 用 
户 感 受到 的 Vo 呼叫 的 质量 。 这 个 问题 将 在 本 章 结束 的 课 后 作业 中 进一步 探讨 。 

1.4.4 计算 机 网 络 中 的 吞吐 量 

除了 时 延 和 丢 包 ， 计 算 机 网 络 中 另 一 个 必 不 可 少 的 性 能 测度 是 端 到 端 吞 吐 量 。 为 了 定 
义理 吐 量 ， 考 虑 从 主机 A 到 主机 B 跨越 计算 机 网 络 传送 一 个 大 文件 。 例 如， 也 许 是 从 一 个 
P2P 文件 共享 系统 中 的 一 个 对 等 方向 男 一 个 对 等 方 传送 一 个 大 视频 片段 ,在 任何 时 间 瞬 间 
的 瞬时 吞吐 量 (instantaneous throughput) 是 主机 B 接收 到 该 文件 的 速率 (以 bps it). (iF 
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AI Bele Ft & SC EE RS, HEP A i) A iba EA Ae ae, FIR 
以 前 已 经 观察 过 它 !) 如 果 该 文件 由 下 比特 组 成 ， 主 机 B 接收 到 所 有 比特 用 去 7 了 秒 ， 则 
文件 传送 的 平均 吞吐 量 (average throughput) 是 F/T bps， 对 于 某 些 应 用 程序 如 因特网 电话 ， 
布 望 具 有 低 时 延 和 在 某 个 国 什 之 上 的 一 致 的 瞬时 行 吐 量 。 例 如 ， 对 采 些 因特网 电话 是 超过 
24kbps ， 对 某 此 实时 视频 应 用 程序 是 超过 256kbps。 对 于 其 他 应 用 程序 ， 包 括 涉及 文件 传送 
的 那些 应 用 程序 ， 时 延 不 是 至 关 重 要 的 ， 但 是 布 望 具有 尽 可 能 高 的 吞吐 量 。 

为 了 进一步 深 和 人 理解 吞吐 量 这 个 重要 概念 ， 我 们 考虑 几 个 例子 。 图 1-19a 显示 了 服务 
希 和 客户 这 两 个 端 系统 ， 它 们 巾 两 条 通信 和 链 路 和 一 人 台 路 由 磊 相 连 。 考 虑 从 服务 硕 传 送 一 
文件 到 客户 的 硅 吐 量 。 令 R, 表示 服务 需 与 路 由 喜之 间 的 链 路 速率 ; R. 表示 路 由 硕 与 客户 
之 间 的 链 路 速率 。 假 定 在 整个 网 络 中 只 有 从 这 人 台 服 务 郑 到 那 台 客户 的 比特 在 传送 。 在 这 种 
理想 的 情况 下 ， PANT SR GE FA AH 95 REE PE Ae Be 多少 ”为 了 回答 这 个 问题 ， 我 们 可 
eee inant 通信 链 路 是 管道 。 显 然 ， 这 人 台 服 务 需 不 能 以 快 于 民 bps 的 速率 通过 其 
链 路 注入 比特 ; 这 台 路 由 带 也 不 能 以 快 于 R. bps 的 速率 转发 比特 。 如 末 R、<R.， 则 由 该 服 
dg 流动 "， 并 以 速率 R, bps 到 达 客 户 ， 给 定 T R, bps 
的 否 吐 量 。 在 男 一 方面 ， 如 果 R < 及 .， 则 该 路 由 需 将 不 能 够 以 接收 它们 那样 快 的 速率 来 转 
发 比特 。 在 这 种 情况 下 ， 比 特 将 以 速率 民 . SP i, A m Bll eg Pe OR (还 
要 注意 的 是 ， 如 果 比 特 继续 以 速率 R 到 达 该 路 由 融 ， 继 续 以 及 . 离开 路 由 需 的 话 ， 在 该 路 
sll E 这 是 一 种 非常 不 布 望 的 情况 !) 因此 ， 对 

这 种 简单 的 两 链 路 的 网 络 ， 其 否 吐 量 是 min | R,.，R.| ， 这 就 是 说 ， 它 是 瓶颈 链 路 〈bot- 
ea ws 
答 一 个 正比 特 的 大 文件 所 需要 的 时 间 是 f/min| R.，R.|。 对 于 一 个 特定 的 例子 ， 假 定 你 正 
在 下 载 一 个 =32 x10 比特 的 MP3 文件 ， 服 务 器 具有 R, =2Mbps 的 传输 速率 ， 并 且 你 有 
一 条 R, =1Mbps 的 接 入 链 路 。 则 传输 该 文件 所 需 的 时 间 是 32 PD, 当然 ， 这些 吞吐 量 和 传 
送 时 间 的 表达 式 仅 是 近似 的 ， 因 为 它们 并 没有 考虑 分 组 层次 和 协议 的 问题 ， 
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图 1-19 一 个 文件 从 服务 需 传 送 到 客户 的 吞吐 量 


ee iN 条 链 路 的 传 
输 速 率 分 别 是 R, Ry, ot, Ryo 应 用 与 对 两 条 链 路 网 络 的 分 析 相 同 的 方法 ， 我 们 发 现 从 
服务 器 到 客户 的 文件 传输 的 否 吐 量 是 min} Ri ，R,，…，R、| ， 这 同样 仍 是 沿 看 服务 各 和 客 
户 之 间 路 径 的 瓶颈 链 路 的 速率 。 
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现在 考虑 由 当前 因特网 所 引发 的 另 一 个 例子 。 图 1-20a 显示 了 与 一 个 计算 机 网 络 相连 
的 两 个 端 系统 : 一 台 服 务 右 和 一 个 客户 。 考虑 从 服务 器 回 客户 的 文件 传送 的 行 吐 量 、 服 务 
A DA TH ROR, 的 接 入 速率 与 网 络 相 连 ， 且 客户 以 速率 为 R, 的 接 入 速率 与 网 络 相 连 ， 现 在 
假定 在 计算 机 网 络 核 心中 的 所 有 链 路 具有 非常 高 的 传输 速率 ， 即 该 速率 比 R. A R 要 高 得 
多 。 目 前 因特网 的 核心 的 确 过 度 装 备 了 高 速率 的 链 路 ， 从 而 很 少 出 现 拥 塞 。 同 时 假定 在 整 
个 网 络 中 发 送 的 比特 都 是 从 该 服务 器 到 该 客户 。 在 这 个 例子 中 ， 因 为 计算 机 网 络 的 核心 就 
像 一 个 宽大 的 管子 ， 所 以 比特 从 服务 器 向 目的 地 的 流动 速率 仍 是 及 和 R. 中 的 最 小 者 ， 即 
Fiti = min|1 及 .， 民 .| 。 因 此 ， 在 今天 因特网 中 对 乔 吐 量 的 限制 因 系 通 稼 是 按 和 网。 

作为 最 后 一 个 例子 ， 考 虑 图 1-20b， 其 中 有 10 FARE AEA 10 个 客户 与 某 计 算 机 网 络 
Touti, 在 这 个 例子 中 ， 同 时 发 生 10 个 下 载 ， 涉 及 10 个 客户 -服务 器 对 。 假定 这 10 

个 下 载 是 网 络 中 当时 的 唯一 流量 。 如 该 图 所 示 ， 在 核心 中 有 一 条 所 有 10 个 下 载 通过 的 链 

< 将 这 条 链 路 OR 的 传输 速率 表示 为 R, (BET AAR SH ti de A ERR BOA TB eR R, Fr 
有 客户 接 入 链 路 具有 相同 的 速率 R.， 并 且 核 心中 除了 速率 为 R 的 一 条 共 : 同 链 路 之 外 的 | 所 
有 链 路 传输 速率 都 比 R, R, 和 只 大 得 多 现在 我 们 要 问 ， 这 种 下 载 的 重 吐 量 是 多 少 ?” 显 
然 ， 如 果 该 公共 链 路 的 速率 RR 很 大 ， 比 如 说 比 R. AR 大 100 倍 ， 则 每 个 下 载 的 吞吐 量 将 
仍然 是 min1R.，R.! 。 但 是 如 果 该 公共 链 路 的 速率 与 R. ALR, 有 相同 量 级 会 怎样 呢 ? 在 这 
种 情况 下 其 吞吐 量 将 是 多 少 呢 ? 让 我 们 观察 一 个 特定 的 例 了 于。 假定 R, = 2Mbps, R, = 
1Mbps，R =5Mbps， 并 且 公 共 链 路 在 10 个 下 载 之 间 平 等 划分 它 的 传输 速率 。 这 时 每 个 下 
载 的 瓶 颂 不 再 位 于 接 入 网 中 ， 而 是 位 于 核心 中 的 共享 链 路 了 ， 该 瓶 贷 仅 能 为 每 个 下 载 提供 
500kbps 的 吞吐 量 。 因 此 每 个 下 载 的 端 到 端 吞 吐 量 现在 减少 到 500kbps. 
10 个 服务 器 





10 个 客户 
a) 客户 从 服务 器 下 载 一 个 文件 b) 10 个 客户 从 10 个 服务 器 下 载 文件 
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Fe] 1-19 和 图 1-20 中 的 例子 说 明知 叶 量 取决 于 数据 流 过 的 链 路 的 传输 速率 。 我 们 看 到 
当 没 有 其 他 十 扰 流 量 时 ， 其 耕 吐 量 能 够 近似 为 沿 着 源 和 目的 地 之 间 路 径 的 最 小 传输 速率 。 
图 1-20b 中 的 例子 更 一 般 地 说 明了 吞吐 量 不 仅 取 决 于 沿 着 路 径 的 传输 速率 ,而 且 取 决 于 干 
扰 流 量 。 特 别 是 ， 如 果 许 多 其 他 的 数据 流 也 通过 这 条 链 路 流动 ， 一 条 具有 高 传输 速率 的 链 
路 仍然 可 能 成 为 文件 传输 的 瓶 癸 链 路 。 我 们 将 在 谍 后 习题 中 和 后 继 草 节 中 更 仔细 地 人 研究 计 
算 机 网 络 中 的 吞吐 量 .， 


1.5 协议 层次 及 其 服务 模型 


从 我 们 到 目前 的 讨论 来 看 ， 因 特 网 是 一 个 极为 复杂 的 系统 .我 们 已 经 看 到 ， 因 特 网 有 
证 多 部 分 : 大 量 的 应 用 程序 和 协议 、 各 种 类 型 的 端 系统 、 分 组 交换 机 和 各 种 类 型 的 链 路 级 
媒体 面 对 这 种 巨大 的 复杂 性 ， 存 在 着 组 织 网 络 体系 结构 的 希望 吗 ? 或 者 至 少 存在 着 我 们 
对 网 络 体系 结 构 进 行 讨 论 的 希望 吗 ?” 和 幸运 的 是 ， 对 这 两 个 问题 的 回答 都 是 肯定 的 。 


1.5.1 分 层 的 体系 结构 


在 试图 组 织 我 们 关于 因特网 体系 结构 的 想法 之 前 ， 先 看 一 个 人 类 社会 与 之 类 比 的 例 
T. 实际 上 ， 在 日 常生 活 中 我 们 一 直 都 与 复杂 系统 打交道 。 想象 一 下 有 人 请 你 描述 航线 系 
统 的 情况 吧 。 你 怎样 用 一 个 结构 来 换 述 这 样 一 个 复杂 的 系统 ?该 系统 具有 票务 代理 、 行 李 
检查 、 登 机 口 人 员 、 飞 行 员 、 飞 机 、 空 中 航行 控制 和 世界 范围 的 导航 系统 。 描 述 这 种 系统 
的 一 种 方式 是 ， 摘 述 当 你 乘 某 个 航班 时 ， 你 〈 或 其 他 人 蔡 你 ) 要 采取 的 一 系列 动作 。 你 要 
WEHL, ， 托 运行 李 ， 去 登 机 口 ， 并 最 终 登 上 这 次 航班 。 该 飞机 起 飞 ， 飞 行 到 目的 地 。 当 
飞机 着 陆 后 ， 你 从 登 机 口 离 机 并 认领 行李 。 如 果 这 次 行程 不 理想 ， 你 向 票务 机 构 投 诉 这 次 
航班 〈 你 的 努力 一 无 所 获 ) - 图 1-21 显示 了 相关 情况 

我 们 已 经 能 从 这 里 看 出 与 计算 机 网 络 的 
革 些 类 似 : 航空 公司 把 你 从 源 送 到 目的 地 ; 
而 分 组 被 从 因特网 中 的 源 主机 送 到 目的 主 
BL. 但 这 不 是 我 们 寻求 的 完全 的 类 似 。 我 们 ”票务 “购买 ， 
在 图 1-21 中 寻找 革 些 结构 。 观 察 图 1-21， 我 行李 托运) 
们 注意 到 在 每 一 端 都 有 票务 功能 ; 还 对 已 经 
检票 的 乘客 有 行李 功能 ， 对 已 经 检票 并 已 经 BH EBD 
从 查 过 行李 的 乘客 有 登 机 功能 。 对 于 那些 已 MEREK 
经 通过 登 机 的 乘客 ( 即 已 经 经 过 检票 、 行 李 按 路 线 飞行 
检查 和 通过 登 机 的 乘客 )， 有 起 飞 和 着 陆 的 aa 
功能 ， 并 且 在 飞行 中 ， 有 飞机 按 预 定 路 线 飞 
行 的 功能 。 这 提示 我 们 能 够 以 水 平 的 方式 看 
待 这 些 功 能 ， 如 图 1-22 所 示 。 

图 1-22 将 航线 功能 划分 为 一 些 层次 ， 提 供 了 我 们 能 够 讨论 航线 旅行 的 框架 。 值 得 注 
意 的 是 每 个 层次 与 其 下 面 的 层次 结合 在 一 起 ， 实 现 了 某 些 功能 、 服 务 。 在 票务 层 及 以 下 ， 
完成 了 一 个 人 的 航线 柜台 到 航线 柜台 的 转移 。 在 行李 层 及 以 下 ， 完 成 了 人 和 行李 的 行李 托 
运 到 行李 认领 的 转移 。 值 得 注意 的 是 行李 层 仅 对 已 经 完成 票务 的 人 提供 服务 。 在 登 机 口 


i 





图 1-21 箭 飞 机 旅行 的 一 系列 动作 


x 


灵 ， 完 成 了 人 和 行李 的 离 港 登 机 口 到 到 港 登 机 口 的 转移 ， 在 起 飞 /着 陆 层 ， 完 成 了 一 个 人 
及 其 行李 的 跑道 到 跑道 的 转移 ， 每 个 层次 通过 以 下 方式 提供 服务 ，D 在 这 层 中 执行 了 某 些 
动作 (例如 ， 在 登 机 口 层 ， 某 飞机 的 乘客 登 机 和 离 机 ) ; 四 使 用 直接 下 层 的 服务 (例如 ， 
在 登 机 口 层 ， 使 用 起 飞 /着 陆 层 的 跑道 到 跑道 的 旅客 转移 服务 ) . 
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离开 机 场 中 间 空 中 交通 控制 中 心 到 达 机 场 


图 1-22 航线 功能 的 水 平分 层 





利用 分 层 的 体系 结构 ， 我 们 可 以 讨论 一 个 定义 良好 的 、 大 而 复杂 系统 的 特定 部 分 ， 这 
种 简化 本 映 由 于 提供 模块 化 而 具有 很 高 价值 ， 这 使 实现 由 层 所 提供 的 服务 易于 改变 。 只 要 
沪 层 对 其 上 面 的 层 提供 相同 的 服务 ， 并 且 使 用 来 目下 面 层 次 的 相同 服务 ， 当 茶 层 的 实现 要 
化 时 ， 该 系统 的 其 余部 分 保持 不 变 。( 值得 注意 的 是 ,改变 一 个 服务 的 实现 与 改变 服务 本 
身 是 极为 不 同 的 !) 例如 ， 如 果 登 机 口 功 能 被 改变 了 (例如 让 人 们 按 映 高 登 机 和 离 机 )， 
航线 系统 的 其 余部 分 将 保持 不 变 ， 因 为 登 机 口 仍然 提供 相同 的 功能 (人 们 登 机 和 离 机 ) ; 
改变 后 ， 它 仅 是 以 不 同 的 方式 实现 了 该 功能 。 对 于 大 而 复杂 且 需 要 不 断 更 新 的 系统 ,改变 
服务 的 实现 而 不 影响 该 系统 其 他 组 件 是 分 层 的 男 一 个 重要 优点 . 

1. 协议 分 层 

我 们 对 航线 已 经 进行 了 充分 讨论 ， 现 将 注意 力 转 回 网 络 协议 。 为 了 给 网 络 协议 的 设计 
提供 一 个 结构 ， 网 络 设计 者 以 分 层 (layer) 的 方式 组 织 协议 以 及 实现 这 些 协议 的 网 络 使 件 
和 软件 。 每 个 协议 属于 这 些 层次 之 一 ， 就 像 图 1-22 所 示 的 航线 体系 结构 中 的 每 种 功能 属 
于 某 一 层 一 样 。 我 们 再 次 关注 某 层 疝 它 的 上 一 层 提 供 的 服务 (service), ， 即 所 谓 一 层 的 服 
务 模型 (service model) 。 就 像 前 面 航线 例子 中 的 情况 一 样 ， 每 层 通过 在 该 层 中 执行 某 些 动 
作 或 使 用 直接 下 层 的 服务 来 提供 服务 。 例 如 ， 由 第 n 层 提供 的 服务 可 能 包括 报 文 从 网 络 的 
一 边 到 男 一 边 的 可 靠 传 送 。 这 可 能 是 通过 使 用 第 n - 1 层 的 边缘 到 边缘 的 不 可 徘 报 文 传送 
服务 ， 加 上 第 n 层 的 检测 和 重 传 丢 失 报 文 的 功能 来 实现 的 。 

一 个 协议 层 能 够 用 软件 、 硬 件 或 两 者 的 结合 来 实现 。 诸 如 HTTP 和 SMTP 这 样 的 应 用 
层 协议 几乎 总 是 在 端 系统 中 用 软件 实现 的 ， 运 输 层 协议 也 是 如 此 。 因 为 物理 层 和 数据 链 路 
层 负责 处 理 跨 越 特 定 链 路 的 通信 ， 它 们 通常 是 实现 在 与 给 定 链 路 相 联系 的 网 络 接口 卡 〈 例 
如 以 太 网 或 WiFi 接口 卡 ) 中 。 网 络 层 经 常 是 硬件 和 软件 实现 的 混合 体 。 还 要 注意 的 是 ， 
如 同 分 层 的 航线 体系 结构 中 的 功能 分 布 在 构成 该 系统 的 各 机 场 和 飞行 控制 中 心中 一 样 ， 一 
个 第 n 层 协议 也 分 布 在 构成 该 网 络 的 端 系统 、 分 组 交换 机 和 其 他 组 件 中 。 这 就 是 说 ,第 nn 
层 协议 的 不 同 部 分 第 第 位 于 这 些 网 络 组件 的 各 部 分 中 . 

协议 分 层 具 有 概念 化 和 结构 化 的 优点 [RFC 3439 | 。 如 我 们 看 到 的 那样 ,分 层 提供 了 
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一 种 结构 化 方式 来 讨论 系统 组 件 。 模块 化 使 更 新 系统 组 件 更 为 容易 。 然 而 ， 需 要 提 及 的 
是 ， 某 些 人 研究 人 员 和 联网 工程 师 激 烈 地 反对 分 层 [| Wakeman 1992 | 。 分 层 的 一 个 潜在 缺点 
是 一 层 可 能 元 余 较 低层 的 功能 。 例如， 许多 协议 栈 在 基于 每 段 链 路 和 基于 闪 到 端 两 种 情况 
下 ， 都 提供 了 差错 恢复 。 第 二 种 潜在 的 缺点 是 革 层 的 功能 可 能 需要 仅 在 其 他 某 层 才 出 现 的 
信息 (QUIT AMAL). ， 这 违反 了 层次 分 离 的 目标 。 

将 这 些 综合 起 来 ， 各 层 的 所 有 协议 被 称 为 协议 栈 (protocol stack ) 。 因 特 网 的 协议 栈 由 
5 个 层次 组 成 : 物理 层 、 链 路 层 、 网 络 层 、 运 输 层 和 应 用 层 (如 图 1-23a 所 示 )。 如 果 你 查 
看 本 书目 录 ， 将 会 发 现 我 们 大 致 是 以 因特网 协议 栈 的 层次 来 组 织 本 书 的 。 我 们 采用 了 自 顶 
向 下 方法 (top-down approach) ， 首 先 处 理应 用 层 ， 然 后 问 下 进行 处 理 . 

(1) MHE 

应 用 层 是 网 络 应 用 程序 及 它们 的 应 用 层 协 
议 存 留 的 地 方 。 因 特 网 的 应 用 层 包 括 许 多 协 
iM, fan HTTP ( 它 提供 了 Web 文档 的 请 求 和 
传送 )，SMTP ( 它 提供 了 电子 邮件 报 文 的 传 
省 ) 和 和 FTP ( 它 提供 两 个 端 系 统 之 间 的 文件 
传送 ) 。 我 们 将 看 到 ， 某 些 网 络 功能 ， 如 将 像 
www. ietf. org 这 样 对 人 友好 的 端 系 统 名 字 转 换 
为 32 比特 网 络 地 址 ， 也 是 依 助 于 特定 的 应 用 
层 协 议 即 域 攻 系统 (DNS) 完成 的 。 我 们 将 在 开罗 
第 2 章 中 看 到 ， 创 建 并 部 署 我 们 自己 的 新 应 用 图 1-23 ”因特网 协议 栈 和 OST 参考 模型 
层 协议 是 非常 容易 的 。 

应 用 层 协议 分 布 在 多 个 端 系 统 上 ， 一 个 端 系 统 中 的 应 用 程序 使 用 协议 与 男 一 个 端 系 统 
中 的 应 用 程序 交换 信息 的 分 组 。 我 们 把 这 种 位 于 应 用 层 的 信息 分 组 称 为 报 文 (message ) ， 

(2) 运输 层 

因特网 的 运输 层 在 应 用 程序 端点 之 间 传 送 应 用 层 报 文 。 在 因特网 中 ， 有 两 个 运输 协 
im, BI TCP 和 UDP， 利 用 其 中 的 任 一 个 都 能 运输 应 用 层 报 文 。TCP 向 它 的 应 用 程序 提供 了 
面向 连接 的 服务 。 这 种 服务 包括 了 应 用 层 报 文 向 目的 地 的 确保 传递 和 流量 控制 即 发 送 方 
/接收 方 速率 匹配 ) TCP 也 将 长 报 文 划分 为 短 报 文 ， 并 提供 拥塞 控制 机 制 ， 因 此 当 网 络 拥 
塞 时 ， 源 抑制 其 传输 速率 。UDP 协议 向 它 的 应 用 程序 提供 无 连接 服务 。 这 是 一 种 不 提供 不 
必要 服务 的 服务 ， 没有 可 徘 性 ， 没 有 流量 控制 ， 也 没有 拥塞 控制 。 在 本 书 中 ， 我 们 把 运输 
层 分 组 称 为 报 文 段 (segment ) 。 

(3) 网 络 层 

因特网 的 网 络 层 负责 将 称 为 数据 报 ( datagram) 的 网 络 层 分 组 从 一 台 主 机 移动 到 为 一 
台 主 机 。 在 一 台 源 主机 中 的 因特网 运输 层 协议 (TCP a UDP) 问 网 络 层 递交 运输 层 报 文 段 
和 目的 地 址 ， 就 像 你 通过 邮政 服务 寄 信件 时 提供 一 个 目的 地 址 一 样 。 

因特网 的 网 络 层 包括 著名 的 IP 协议 ， 该 协议 定义 了 在 数据 报 中 的 各 个 字段 以 及 端 系 
统 和 路 由 需 如 何 作 用 于 这 些 字 段 。 仅 有 一 个 了 下 协议 ， 所 有 上 有 具有 网 络 层 的 因特网 组 件 必 须 
运行 卫 协 议 。 因特网 的 网 络 层 也 包括 决定 路 由 的 路 由 选择 协议 ， 它 使 得 数据 报 根据 该 路 
由 从 源 传输 到 目的 地 。 因 特 网 具有 许多 路 由 选择 协议 。 如 我 们 在 1.3 节 所 见 ， 因 特 网 是 一 
个 网 络 的 网 络 ， 在 一 个 网 络 中 ， 其 网 络 管理 者 能 够 运行 所 希望 的 任何 路 由 选择 协议 。 尽 管 
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网 络 层 包括 了 IP 协议 和 一 些 路 由 选 拌 协议， 但 通 第 把 它 人 简单 地 称 为 1P 层 ， 这 反映 了 了 IP 是 
将 因特网 连接 在 一 起 的 粘 合 剂 这 样 的 事实 ， 

(4) 链 路 层 

因特网 的 网 络 层 通过 源 和 目的 地 之 间 的 一 系列 路 由 闫 路 由 数据 报 ， 为 了 将 分 组 从 一 个 
结 点 〈 主 机 或 路 由 需 ) 移动 到 路 人 径 上 的 下 一 个 结 点 ， 网 络 层 必须 依 徘 该 链 路 层 的 服务 。 特 
川 是 在 每 个 结 点 ， 网 络 层 将 数据 报 下 传 给 链 路 层 ， 链 路 层 沿 者 路 径 将 数据 报 传递 给 下 一 个 
结 点 。 在 下 个 结 点 ， 链 路 层 将 数据 报 上 传 给 网 络 层 。 

由 链 路 层 提 供 的 服务 取决 于 应 用 于 该 链 路 的 特定 链 路 层 协议 。 例 如 ， 某 些 协 议 基 于 链 
路 提供 可 靠 传递 ， 从 传输 结 点 跨越 一 条 链 路 到 接收 结 点 -值得 注意 的 是 ， 这 种 可 靠 的 传递 
服务 不 同 于 TCP 的 可 靠 传 递 服务 ，TCP 提供 从 一 个 端 系 统 到 男 一 个 并 系 统 的 可 靠 交 付 。 链 
路 层 的 例子 包括 以 太 网 、WiFi 和 电费 接 入 网 的 DOCSIS 协 以 。 因 为 数据 报 从 源 到 目的 地 传 
送 通常 需要 经 过 几 条 链 路 ， 一 个 数据 报 可 能 被 沿途 不 同 链 路 上 的 不 同 链 路 层 协议 处 理 ， 例 
如 ， 一 个 数据 报 可 能 被 一 段 链 路 上 的 以 太 网 和 下 一 段 链 路 上 的 PPP 所 处 理 。 网络 层 将 受到 
来 自 每 个 不 同 的 链 路 层 协 议 的 不 同 服务 。 在 本 书 中 ， 我们 把 链 路 层 分 组 称 为 帧 (frame ) . 

(5) 物理 层 

时 然 链 路 层 的 任务 是 将 整个 帧 从 一 个 网 络 元 素 移 动 到 邻近 的 网 络 元 素 ， 而 物理 层 的 任 

是 将 该 帧 中 的 一 个 一 个 比特 从 一 个 结 点 移动 到 下 一 个 结 点 .在 这 层 中 的 协议 仍然 是 链 路 

相关 的 ， 并 且 进 一 步 与 该 链 路 (例如 ， 双 绞 铜 线 、 单 模 光 纤 ) 的 实际 传输 媒体 相关 。， 例 
如 ， 以 太 网 具有 许多 物理 层 协议 : 一 个 是 关于 双 纹 和 铀 线 的 ， 为 一 个 是 关于 同 轴 电 绕 的， 还 
有 一 个 是 关于 光纤 的 ， 等 等 。 在 每 种 场合 中 ， 蜂 越 这 些 链 路 移动 一 个 比特 是 以 不 同 的 方式 
进行 的 。 

2. OSI 模型 

详细 地 讨论 过 因特网 协议 栈 后 ,我 们 应 当 提 及 它 不 是 唯一 的 协议 栈 。 特 别 是 在 20 tit 
纪 70 年 代 后 期 ， 国 际 标准 化 组 织 (1S0) 提出 计算 机 网 络 应 组 织 为 大 约 7 层 ， 称 为 开放 系 
统 互 连 (OSL) 模型 [ISO 2012 |] 。 当 那些 要 成 为 因特网 协议 的 协议 尚 处 于 初 神 中， 只 是 许 
多 正在 研发 之 中 的 不 同 协议 族 之 一 时 ，0SI1 模型 已 经 成 形 ; 事实 上 ， 初始 OSI 模型 的 发 明 
者 在 创建 该 模型 时 心中 并 没有 想到 因特网 。 无 论 如 何 ， 自 20 世纪 70 年 代 开 始 ， 许 多 培训 
课程 和 大 学 课程 围绕 7 层 模型 挑选 有 关 ISO 授权 和 组 织 的 课程 。 因 为 它 在 网 络 教育 的 早期 
影响 ， 该 7 层 模型 继续 以 某 种 方式 存留 在 某 些 网 络 教 科 书 和 培训 诛 程 中 。 

显示 在 图 1-23b 中 的 OSI 参考 模型 的 7 层 是 : 应 用 层 、 表 示 层 、 会 话 层 、 运 输 层 、 网 
络 层 、 数 据 链 路 层 和 物理 层 ， 这 些 层次 中 ,5 层 的 功能 大 致 与 它们 名 字 类 似 的 因特网 对 应 
层 的 相同 : 所 以 ， 我 们 来 考虑 OSI 参考 模型 中 附加 的 两 个 层 ， 即 表示 层 和 会 话 层 。 表 示 层 
的 作 几 是 使 授信 的 应 用 程 夺 能 够 解释 交换 数据 的 含义 。 这 些 服 务 包括 数据 压缩 和 数据 加 密 
(它们 是 和 目 解释 的 ) 以 及 数据 描述 (如 我 们 将 在 第 9 章 所 见 ， 这 使 得 应 用 程序 不 必 担 心 在 
各 台 计 算 机 中 表示 /存储 的 内 部 格式 不 同 的 问题 ) 。 会 话 层 提供 了 数据 交换 定 界 和 同步 功 
能 ， 包 括 了 建立 检查 点 和 恢复 方案 的 方法 .。 

因特网 缺少 了 在 OSI 参考 模型 中 建立 的 两 个 层次 ， 该 事实 引起 了 一 些 有 趣 的 问题 : 这 
些 层 次 提供 的 服务 不 重要 吗 ?7 如 果 一 个 应 用 程序 需要 这 些 服务 之 一 ， 将 会 怎样 呢 ? 因特网 
对 这 两 个 问题 的 回答 是 相同 的 : 这 和 留 给 应 用 程序 开发 者 处 理 。 应 用 程序 开发 者 决定 一 个 服 
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务 是 否 是 重要 的 ， 如 果 该 服务 重要 ， 应 用 程序 开发 者 就 应 该 在 应 用 程序 中 构建 该 功能 。 
1.5.2 H% 


图 1-24 显示 了 这 样 一 条 物理 路 径 : 数据 从 发 送 端 系统 的 协议 栈 向 下 ， 向 上 和 向 下 经 
过 中 间 的 链 路 层 交 换 机 和 路 由 占 的 协议 栈 ， 进 而 向 上 到 达 接 收 端 系统 的 协议 栈 。 如 我 们 将 
在 本 书后 面 讨论 的 那样 ， 路 由 融和 链 路 层 交 换 机 都 是 分 组 交换 机 。 与 端 系统 类 似 ， 路 由 天 
和 链 路 层 交 换 机 以 多 层次 的 方式 组 织 它们 的 网 络 硬件 和 软件 。 而 路 由 融和 链 踏 层 交 换 机 并 
不 实现 协议 栈 中 的 所 有 层次 。 如 图 1-24 所 示 ， 链 路 层 交 换 机 实现 了 第 一 层 和 第 二 层 ; 路 
由 器 实现 了 第 一 层 到 第 三 层 。 例 如 ， 这 意味 着 因特网 路 由 器 能 够 实现 IP 协议 (一 种 第 三 
层 协议 ) ， 而 链 路 层 交 换 机 则 不 能 。 我 们 将 在 后 面 看 到 ， 尽 管 链 路 层 交 换 机 不 能 识别 IP 地 
址 ， 但 它们 能 够 识别 第 二 层 地 址 ， 如 以 太 网 地 址 。 值 得 注意 的 是 ， 主 机 实现 了 所 有 5 个 层 
次 ， 这 与 因特网 体系 结构 将 它 的 复杂 性 放 在 网 络 边 绿 的 观点 是 一 致 的 。 
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链 路 层 交换 机 


H, H, M 
图 1-24 主机 、 路 由 器 和 链 路 层 交 换 机 ， 每 个 包含 了 不 同 的 层 ， 反 映 了 不 同 的 功能 


图 1-24 也 说 明了 一 个 重要 概念 : 封装 (encapsulation), fF ARIK EPL, — MAR 
报 文 (application-layer message) (图 1-24 中 的 M) 被 传送 给 运输 层 。 在 最 简单 的 情况 下 ， 
运输 层 收 取 到 报 文 并 附 上 附加 信息 (所 谓 运输 层 首部 信息 ， 图 1-24 中 的 H,)， 该 首部 将 被 
接收 端的 运输 层 使 用 。 应 用 层 报 文 和 运输 层 首 部 信息 一 道 构 成 了 运输 层 报 文 段 (transport- 
layer segment) 。 运 输 层 报 文 段 因 此 封装 了 应 用 层 报 文 。 附 加 的 信息 也 许 包 括 了 下 列 信 息 : 
如 人 允许 接收 端 运输 层 同 上 向 适当 的 应 用 程序 交付 报 文 的 信息 ; 如 差错 检测 位 信息 ， 该 信息 
让 接收 方 能 够 判断 报 文 中 的 比特 是 否 在 途中 已 被 改变 。 运 输 层 则 同 网 络 层 传递 该 报 文 段 ， 
网 络 层 增加 了 如 源 和 目的 端 系统 地 址 等 网 络 层 首部 信息 (图 1-24 中 的 HL), E TA 
层 数据 报 (network-layer datagram) 。 该 数据 报 接 下 来 被 传递 给 链 路 层 ， 链 路 层 〈 目 然而 然 
地 ) 增加 它 自 己 的 链 路 层 首 部 信息 并 创建 链 路 层 帧 (link-layer frime), ML, RITA FIE 
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每 一 层 ， 一 个 分 组 具有 两 种 类 型 的 字段 : 首部 字段 和 有 效 载荷 字段 (payload field), A 
载荷 通常 是 来 自 上 一 层 的 分 组 。 

这 里 一 个 有 用 的 类 比 是 经 过 公共 邮政 服务 在 某 公司 分 支 办 公 室 之 间 发 送 一 封 备忘录 ， 
假定 位 于 一 个 分 支 办 公 室 的 Alice 要 向 位 于 另 一 个 分 支 办 公 室 的 Bob 发 送 一 封 备忘录 。 该 
备忘录 类 比 于 应 用 层 报 文 。Alice 将 备忘录 放 入 办公室 之 间 的 公函 信封 中 ， 并 在 公函 信封 
上 方 写 上 了 Bob 的 名 字 和 部 门 编号 。 该 办 公 室 之 间 的 公函 信封 类 比 于 运输 层 报 文 段 ， 即 它 
包括 了 首部 信息 (Bob 的 名 字 和 部 门 编码 ) 并 封装 了 应 用 层 报 文 (备忘录 ) 。 当 发 送 方 分 
支 办 公 室 的 收发 室 拿 到 该 办 公 室 之 间 的 备忘录 ,将 其 放 入 适合 在 公共 邮政 服务 发 送 的 信封 
中 ， 并 在 邮政 信封 上 写 上 发 送 和 接收 分 支 办 公 室 的 邮政 地 址 。 此 处 ， 邮 政信 封 类 比 于 数据 
报 ， 它 封装 了 运输 层 的 报 文 段 (办公 室 之 间 信封 ) ， 该 报 文 段 封装 了 初始 报 文 ( 备忘录) 
邮政 服务 将 该 邮政 信封 交付 给 接收 方 分 支 办 公 室 的 收发 室 。 在 此 处 开始 了 拆 封 过程 。 该 收 
发 室 抽取 了 办 公 室 间 的 备忘录 并 转发 给 Bob。 最 后 ，Bob 打开 封套 并 拿 走 了 备忘录 。 

封装 的 过 程 能 够 比 前 面 描述 的 更 为 复杂 。 例 如 ， 一 个 大 报 文 可 能 被 划分 为 多 个 运输 层 
的 报 文 段 〈 这 些 报 文 段 每 个 可 能 被 划分 为 多 个 网 络 层 数据 报 ) 。 在 接收 端 ， 则 必须 从 其 连 
续 的 数据 报 中 重 构 这 样 一 个 报 文 段 。 


1.6 面 对 攻 击 的 网 络 


对 于 今天 的 许多 机 构 (包括 大 大 小 小 的 公司 、 大 学 和 政府 机 关 ) 而 言 ， 因 特 网 已 经 成 
为 与 其 使 命 密切 相关 的 一 部 分 了 。 许 多 个 人 也 依赖 因特网 进行 许多 职业 、 社 会 和 个 人 活 
动 。 但 是 在 所 有 这 一 切 背 后 ， 存 在 着 一 个 阴暗 面 ， 其 中 的 “ 坏 家 伙 ” 试 图 对 我 们 的 日 常生 
活 中 进行 破坏 ， 如 损坏 我 们 与 因特网 相连 的 计算 机 ， 侵 犯 我 们 的 隐私 以 及 使 我 们 依赖 的 因 
特 网 服务 无 法 运行 。 

网 络 安全 领域 主要 探讨 以 下 问题 : 坏 家 伙 如 何 攻击 计算 机 网 络 ， 以 及 我 们 (即将 成 为 
计算 机 网 络 的 专家 ) 如 何 防御 以 免 受 他 们 的 攻击 ， 或 者 更 好 的 是 设计 能 够 事先 免除 这 样 的 
攻击 的 新 型 体系 结构 。 面 对 经 常 发 生 的 各 种 各 样 的 现 有 攻击 以 及 新 型 和 更 具 摧毁 性 的 未 来 
攻击 的 威胁 ， 网 络 安全 已 经 成 为 近年 来 计算 机 网 络 领域 的 中 心 主题 。 本 书 的 特色 之 一 是 将 
网 络 安 全 问题 放 在 中 心 位 置 。 

因为 我 们 在 计算 机 网 络 和 因特网 协议 方面 还 没有 专业 知识 ， 所 以 这 里 我 们 将 开始 审视 
某 些 今天 最 为 流行 的 与 安全 性 相关 的 问题 。 这 将 刺激 我 们 的 胃口 ， 以 便 我 们 在 后 续 童 节 中 
进行 更 为 充实 的 讨论 。 我 们 在 这 里 以 提出 问题 开始 : 什么 东西 会 出 现 问 题 ? 计算 机 网 络 是 
怎样 易于 受到 攻击 的 ? 今天 某 些 最 为 流行 的 攻击 类 型 是 什么 ? 

1. 坏 家 伙 能 够 经 因特网 将 有 害 程序 放 和 人 你 的 计算 机 中 

因为 我 们 要 从 /向 因特网 接收 /发 送 数据 ， 所 以 我 们 将 设备 与 因特网 相连 。 这 包括 各 种 
好 东西 ， 例 如 Web 页 面 、 电 子 邮 件 报 文 、MP3 、 电 话 、 视 频 实况 、 搜 索引 擎 结果 等 。 但 
是 ， 不 幸 的 是 伴随 好 的 东西 而 来 的 还 有 恶意 的 东西 (这些 恶 意 的 东西 可 统称 为 恶意 软件 
( malware) ) ， 它 们 能 够 进入 并 影响 我 们 的 设备 。 一 旦 恶意 软件 感染 我 们 的 设备 ， 就 能 够 做 
各 种 不 正当 的 事情 ， 包 括 删除 我 们 的 文件 ， 安 装 间谍 软件 来 收集 我 们 的 隐私 信息 ， 如 社会 
保险 号 、 口 令 和 击 键 ， 然 后 将 这 些 ( 当然 经 因特网 ) 发 送 给 坏 家 伙 。 我 们 的 受害 主机 也 可 
能 成 为 数 以 千 计 的 类 似 受害 设备 网 络 中 的 一 员 ， 它 们 被 统称 为 僵尸 网 络 (botnet) ， 坏 家 伙 
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利用 僵尸 网 络 控制 并 有 效 地 对 目标 主机 展 和 天 垃圾 邮件 分 发 或 分 布 式 拒绝 服务 攻击 〈 很 快 将 
讨论 ) o 
今天 的 多 数 恶 意 软件 是 自我 复制 (self-replicating) 的 : 一 旦 它 感染 了 一 台 主 机 ， 就 会 
从 那 台 主机 寻求 进入 更 多 的 主机 .以 这 种 方式 ， 日 我 复制 的 恶意 软件 能 够 指数 式 地 快速 扩 
AL. 恶意 软件 能 够 以 病毒 或 师 虫 的 形式 扩散 。 病 毒 (virus) 是 一 种 需要 某 种 形式 的 用 户 区 
下 来 感染 用 户 设备 的 恶意 软件 。 典 型 的 例子 是 包含 普 意 可 执行 代码 的 电子 邮件 附件 。 如 入 
用 户 接收 并 打开 这 样 的 附件 ， 不 经 意 间 就 在 其 设备 上 运行 了 了 该 恶意 软件 。 通 笛 ， 这 种 电子 
邮件 病毒 是 自我 复制 的 : 例如 ， 一 旦 执行 ， 该 病毒 可 能 回 用 户 地 址 秒 上 的 每 个 接收 方 发 送 
一 个 具有 相同 恶意 附件 的 相同 报 文 。 蠕 虫 (worm) 是 一 种 无 需 任何 明 显 用 户 交 互 就 能 进 
入 设备 的 恶意 软件 。 例如， 用 户 也 许 运 行 了 一 个 某 攻击 者 能 够 发 送 恶 意 软 件 的 脆弱 网 络 应 
用 程序 - 在 某 些 情况 下 ， 没 有 用 户 的 任何 干预 ， 该 应 用 程序 可 能 从 因特网 接收 恶意 软件 并 
运行 它 ， 生 成 了 师 虫 。 新 近 感 染 设备 中 的 师 虫 则 能 扫 摘 因特网 ， 搜 索 其 他 运行 相同 易 受 感 
染 的 网 络 应 用 程序 的 主机 。 当 它 发 现 其 他 易 受 感染 的 主机 时 ， 便 回 这 些 主机 发 送 一 个 它 目 
导 的 副本 .今天 ， 亚 意 软件 无 所 不 在 且 造 成 的 损失 惨重 ， 当 你 用 这 本 书 学 习 时 ， 我 们 或 励 
尔 思 考 下 列 问 题 : 计算 机 网 络 设计 者 能 够 采取 什么 防御 措施 ， 以 使 与 因特网 连接 的 设备 免 
受 恶 意 软件 的 攻击 ? 
2， 坏 冢 伙 能 够 攻击 服务 绒 和 网 络 基础 设施 
另 一 种 宽泛 类 型 的 安全 性 威胁 称 为 拒绝 服务 攻击 (Denial- of- Service (DoS) attack), 
顾名思义 ，Dos 攻击 使 得 网 络 、 主 机 或 其 他 基础 设施 部 分 不 能 由 合法 用 户 所 使 用 。Web 服 
Sat. HUME At. DNS 服务 器 (在 第 2 草 中 讨论 ) 和 机 构 网 络 都 能 够 成 为 DoS 攻 
击 的 目标 。 因 特 网 DoS 攻击 极为 常见 ， 每 年 会 出 现 数 以 千 计 的 DoS 攻击 [Moore 2001 ; 
Mirkovic 2005 | 。 大 多 数 因 特 网 DoS 攻击 属于 下 列 三 种 类 型 之 一 : 
e 弱点 攻击 。 这 涉及 同一 台 目 标 主机 上 运行 的 易 受 攻击 的 应 用 程序 或 操作 系统 发 送 
制作 精细 的 报 文 。 如 果 适 当 顺 序 的 多 个 分 组 发 送 给 一 个 易 受 攻击 的 应 用 程序 或 操 
作 系 统 ， 该 服务 此 可 能 停止 运行 ， 或 者 更 糟糕 的 是 主机 可 能 朋 江 。 
e 带宽 洪 泛 。 攻 击 者 向 目标 主机 发 送 大 量 的 分 组 ， 分 组 数量 之 多 使 得 目标 的 接 和 人 链 
路 变 得 拥塞 ， 使 得 合法 的 分 组 无 法 到 达 服 务 需 。 
o 连接 洪 泛 。 攻击 者 在 目标 主机 中 创建 大 量 的 半 开 或 全 开 TCP 连接 (将 在 第 3 
章 中 讨论 TCP 连接 ) 。 该 主机 因 这 些 伪 造 的 连接 而 陷入 困境 ， 并 停止 接受 合 ;} 


的 连接 ， 
我 们 现在 更 详细 地 研究 这 种 带宽 洪 泛 攻击 。 回 顾 1.4.2 节 中 讨论 的 时 延 和 丢 包 问题 ， 


显然 ， 如 果菜 服务 器 的 接 入 速率 为 Rbps， 则 攻击 者 将 需要 以 大 约 R bps 的 速率 来 产生 危 
害 。 如 果 R 非 常 大 的 话 ， 单 一 攻击 源 可 能 无 法 产生 足够 大 的 流量 来 伤害 该 服务 器 。 此 外 ， 
如 果 从 单一 源 发 出 所 有 流量 的 话 ， 上 游 路 由 旨 就 能 够 检测 出 该 攻击 并 在 该 流量 徘 近 服务 前 
前 就 将 其 阻挡 下 来 。 在 图 1-25 中 显示 的 分 布 式 DoS (Distributed DoS, DDoS) 中 ， 攻 击 者 
控制 多 个 源 并 让 每 个 源 回 目标 猛烈 发 送 流量 。 使 用 这 种 方法 ， 为 了 前 弱 或 损坏 服务 名， 通 
及 所 有 受 控 源 的 聚合 流量 速率 需要 大 约 R 的 能 力 。DDoS 攻击 充分 利用 具有 数 以 千 计 的 受 
害 主机 的 僵尸 网 络 在 今天 是 屡见不鲜 的 [Mirkovic 2005 |]。 相 比 于 来 和 目 单一 主机 的 DoS I 
itt, DDoS 攻击 更 加 难以 检测 和 防范 。 
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图 1-25 分 布 式 拒绝 服务 攻击 


当 学 习 这 本 书 时 ， 我 们 鼓励 你 考虑 下 列 问题 ， 计算 机 网 络 设计 者 能 够 采取 哪些 措施 防 
止 DoS 攻击 ? 我 们 将 看 到 ， 对 于 3 种 不 同类 型 的 Dos 攻击 需要 采用 不 同 的 防御 方法 ， 

3、 坏 冢 伙 能 够 嗅 探 分 组 

今天 的 许多 用 户 经 无 线 设 备 接 人 因特网 ， 如 WiFi 连接 的 膝 上 电脑 或 使 用 蜂窝 因特网 
连接 的 手持 设备 (在 第 6 章 中 讨论 ) 。 当 无 所 不 在 的 因特网 接 人 极为 便利 并 使 得 令 人 惊奇 
的 新 应 用 程序 为 移动 用 户 所 用 的 同时 ， 也 产生 了 重大 的 安全 弱点 在 无 线 传输 设备 的 附 
近 放 置 一 台 被 动 的 接收 机 ， 该 接收 机 就 能 得 到 传输 的 每 个 分 组 的 副本 ! 这 些 分 组 包含 了 各 
种 敏感 信息 ,包括 口令 、 社 会 保险 号 、 商 业 秘密 和 隐秘 的 个 人 信息 。 记 录 每 个 流 经 的 分 组 
副本 的 被 动 接收 机 被 称 为 分 组 嗅 探 器 (packet sniffer) 。 

咒 探 禹 也 能 够 部 划 在 有 线 环境 中 。 在 有 线 的 广播 环境 中 ， 如 在 许多 以 太 网 LAN 中 ， 
Th A UTR tHE MS ISAAK LAN 发 送 的 所 有 分 组 。 如 在 1.2 节 中 描述 的 那样 ,电缆 接 入 技 
本 也 广播 分 组 ， 因 此 易于 受到 嗅 探 攻 击 。 此 外 ， 获 得 某 机 构 与 因特网 连接 的 接 和 人 路 由 需 或 
接 入 链 路 访问 权 的 坏 家 伙 能 够 放置 一 台 嗅 探 费 以 产生 从 该 机 构 出 入 的 每 个 分 组 的 副本 ， 青 
对 品 探 到 的 分 组 进行 离线 分 析 ， 就 能 得 出 敏感 信息 。 

分 组 咒 探 软件 在 各 种 Web 站 点 上 可 免费 得 到 ， 这 类 软件 ， 也 有 商用 的 产品 。 教 网 络 
环 程 的 教授 们 布置 的 实验 作业 就 涉及 写 一 个 分 组 嗅 探 器 和 应 用 层 数据 重 构 程 序 。 与 本 书 相 
关联 的 Wireshark | Wireshark 2012] 实验 (参见 本 章 结 尾 处 的 Wireshark 实验 介绍 ) 使 用 
的 正 是 这 样 一 种 分 组 嗅 探 融 ! 

因为 分 组 唱 探 大 是 被 动 的 ， 也 就 是 说 它们 不 回信 道中 注入 分 组 ， 所 以 难以 检测 它们 的 
存在 。 因 此 ， 当 我 们 向 无 线 信道 发 送 分 组 时 ， 我 们 必须 接受 这 样 的 可 能 性 ， 即 某 些 坏 家 伙 
可 能 记录 了 我 们 的 分 组 的 副本 。 如 你 已 经 猜想 的 那样 ， 最 好 的 防御 串 探 的 方法 基本 上 都 与 
密 公 学 有 关 。 我 们 将 在 第 8 章 研 究 密 但 学 应 用 于 网 络 安全 的 有 关内 容 。 

4. 坏 家 伙 能 够 伪装 成 你 信任 的 人 

生成 具有 任意 源 地 址 、 分 组 内 容 和 目的 地 址 的 分 组 ， 然 后 将 这 个 人 工 制 作 的 分 组 传 
得到 因特网 中 极为 容易 〈 当 你 学 完 这 本 教科 书后 ， 你 将 很 快 具 有 这 方面 的 知识 了 1!) ， 
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因特网 将 忠实 地 将 该 分 组 转发 到 上 日 的 地 。 想 象 暴 接 收 到 这 样 一 个 分 组 的 不 可 信 的 接收 方 
(比如 说 一 人 台 因 特 网 路 由 带 )， 将 该 (虚假 的 ) 源 地 址 作为 真实 的 ， 进 而 执行 茶 些 嵌入 
在 该 分 组 内 容 中 的 命令 《比如 说 修改 它 的 转发 表 ) 。 将 具有 虚假 源 地 址 的 分 组 注入 因 特 
网 的 能 力 被 称 为 IP 哄骗 (IP spoofing) ， 而 它 只 是 一 个 用 户 能 够 冒充 为 一 个 用 户 的 许多 
方式 中 的 一 种 。 

为 了 解决 这 个 问题 ， 我 们 需要 采用 端点 鉴别 ， 即 一 种 使 我 们 能 够 确信 一 个 报 文 源 自我 
们 认为 它 应 当 来 日 的 地 方 的 机 制 。 当 你 继续 学 习 本 书 各 草 时 ,再 次 建议 你 思考 霞 样 为 网 络 
应 用 程序 和 协议 做 这 件 事 。 我 们 将 在 第 8 音 研 究 端点 鉴别 机 制 。 

在 本 方 结束 时 ， 值 得 思考 一 下 因特网 是 如 何 从 一 开始 就 落 入 这 样 一 种 不 安全 的 境地 
的 。 大体 上 讲 ， 答 案 是 : 因特网 最 初 就 是 基于 “一 群 相互 信任 的 用 户 连 接 到 一 个 透明 的 网 
络 上 ”这 样 的 模型 [Blumenthal 2001] 进行 设计 的 ， 在 这 样 的 模型 中 ， 安 全 性 没有 必要 。 
初始 的 因特网 体系 结构 的 许多 方面 都 深刻 地 反映 了 这 种 相互 信任 的 观念 。 例 如 ， 一 个 用 户 
癌 任 何其 他 用 户 发 送 分 组 的 能 力 是 默认 的 ， 而 不 是 一 种 请 求 / 准 子 的 能 力 ， 还 有 用 户 身份 
取 晶 所 宣称 的 表面 价值 ， 而 不 是 默认 地 需要 鉴别 。 

但 是 今天 的 因特网 无 疑 并 不 涉及 “相互 信任 的 用 户 ”。 无 论 如 何 , 今天 的 用 户 并 不 是 
必须 相互 信任 的 ， 他 们 仍然 需要 通信 ， 也 许 布 望 匿名 通信 ， 也 许 间接 地 通过 第 三 方 通 信 
(例如 我 们 将 在 第 2 草 中 学 习 的 Web 高 速 缓存 ， 我 们 将 在 第 6 昔 学 习 的 移动 性 协助 代理 ) ， 
也 许 不 信任 他 们 通信 时 使 用 的 硬件 、 软 件 甚 至 空气 。 随 着 我 们 进一步 学 习 本 书 ， 会 面临 许 
多 安全 性 相关 的 挑战 : 我 们 应 当 寻 求 对 咒 探 、 端 点 假冒 、 中 间 人 攻击 、DDoS 攻击 、 亚 意 
软件 等 的 防护 办 法 。 我 们 应 当 记 住 : 在 相互 信任 的 用 户 之 间 的 通信 和 是 一 种 例外 而 不 是 规 
则 。 欢 迎 您 到 现代 计算 机 网 络 世 界 来 ! 


1.7 计算 机 网 络 和 因特网 的 历史 


1.1 证 到 1.6 三 概述 了 计算 机 网 络 和 因特网 的 技术 。 你 现在 应 当 有 足够 的 知识 来 给 家 
人 和 朋友 留 下 深刻 印象 了 。 然 而， 如 果 你 真 的 想 在 下 次 鸡尾酒 会 上 一 鸣 惊 人 ， 你 应 当 在 你 
的 演讲 中 点 组 上 一 些 有 关 因 特 网 3 人 和信 胜 的 历史 轶 闻 [ Segaller 1998 | . 


1.7.1 分 组 交换 的 发 展 : 1961 ~1972 


计算 机 网 络 和 今天 因特网 领域 的 开端 可 以 回溯 到 20 世纪 60 年 代 的 早期 ， 那 时 电话 
网 是 世界 上 占 统治 地 位 的 通信 和 网络 。1.3 届 讲 过 ， 电 话 网 使 用 电路 交换 将 信息 从 发 送 方 
传输 到 接收 方 ， 这 种 适当 的 选择 使 得 语音 以 一 种 恒定 的 速率 在 发 送 方 和 接收 方 之 间 传 
io MÆ 20 世纪 60 年 代 早 期 计算 机 的 重要 性 越 来 越 大 ， 以 及 分 时 计算 机 的 出 现 ， 考虑 
如 何 将 计算 机 连接 在 一 起 ， 并 使 它们 能 够 被 地 理 上 分 布 的 用 户 所 共享 的 问题 ， 也 许 就 成 
了 一 件 目 然 的 事 。 这 些 用 户 所 产生 的 流量 很 可 能 具有 “ 突 发 性 ”， 即 活动 的 间断 性 ， 例 
如 回 远程 计算 机 发 送 一 个 命令 ， 接 着 由 于 在 等 待 应 答 或 在 对 接收 到 的 响应 进行 思考 而 有 
静止 的 时 间 段 。 

全 世界 有 3 个 研究 组 首先 发 明了 分 组 交换 ， 以 作为 电路 交换 的 一 种 有 效 的 、 健 壮 的 替 
代 技 术 。 这 3 个 研究 组 互 不 知道 其 他 人 的 工作 [Leiner 1998 | 。 有 关 分 组 交换 技术 的 首次 
公开 发 表 出 日 Leonard Kleinrock | Kleinrock 1961, Kleinrock 1964 | ， 那 时 他 是 麻 省 理工 学 
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Be (MIT) 的 一 名 人 研究 生 。Kleinrock 使 用 排队 论 ， 完 美 地 体现 了 使 用 分 组 交换 方法 处 理 突 
发 性 流量 有 的 有 效 性 。1964 年 ， 兰 德 公司 的 Paul Baran | Baran 1964] 已 经 开始 研究 分 组 
交换 的 应 用 ， 即 在 军用 网 络 上 传输 安全 语音 ， 同 时 在 英国 的 国家 物理 实验 室 (NPL), 
Donald Davies 和 Roger Scantlebury 也 在 人 研究 分 组 交换 技术 ， 

MIT、 兰 德 和 NPL 的 工作 葛 定 了 今天 的 Pals Pa R 基础 。 但 是 因特网 也 经 历 了 很 长 的 

边 构 建 边 示范 (let’ s-build-it-and- demonstrate-it)” 的 历史 ， 这 可 追 湖 到 20 世纪 60 年代 

FLA J. C. R. Licklider | DEC 1990] 和 Lawrence Roberts 都 是 Kleinrock 在 MIT 的 同事 ， 他 

们 转 而 去 领导 美国 高 级 人 研究 计划 团 ( Advanced Research Projects Agency, ARPA) 的 计算 机 
科学 计划 。Roberts 公布 了 一 个 号 称 ARPAnet | Roberts 1967 | 的 总 体 计 划 ， 它 是 第 一 个 分 
组 交换 计算 机 网 络 ， 是 今天 的 公共 因特网 的 直接 祖先 。 在 1969 年 的 劳动 节 ， 第 一 人 台 分 组 
交换 机 在 Kleinrock 的 监管 下 安装 在 UCLA (美国 加 州 大 学 洛杉矶 分 校 ) ， 其 他 
换 机 不 久 后 安装 在 斯 坦 福 研究 所 eam Research Jnstitute ，SRI) 、 美 国 加 州 大 学 圣 巴 
拉 分 校 (UC Santa Barbara) pele (University of Utah) (参见 图 1-26) 。 习 pi 
因特网 祖先 到 1969 年 年 底 有 了 4 个 结 点 。Kleinrock 回忆 说 ， 该 网 络 的 最 先 应 用 是 从 UCLA 
到 SRI 执行 远程 注册 ， newer AABN Wit | Kleinrock 2004 | . 





图 1-26 一 台 早 期 的 分 组 交换 机 


到 了 1972 Æ, ARPAnet 已 经 成 长 为 约 15 个 结 上 点， 由 Robert Kahn E XXI EH SZ 
众 演示 。 在 ARPAnet 端 系统 之 间 的 第 一 台 主 机 到 主机 协议 称 为 网 络 控制 协议 (NCP) , 
是 此 时 完成 的 【 RFC 001]。 随 着 端 到 疹 协 议 的 可 供 人 使用， 这 时 能 够 与 应 用 程序 卫 。 在 


tt SL PU 2 Fo FE A 43 


1972 4, Ray Tomlinson 编写 了 第 一 个 电子 邮件 程序 . 
1.7.2 专用 网 络 和 网 络 互联 : 1972 ~ 1980 


最 初 的 ARPAnet 是 一 个 单一 的 、 封 闭 的 网 络 。 为 了 与 ARPAnet 的 一 台 主 机 通信 ， 一 
台 主 机 必须 与 另 一 台 ARPAnet IMP 实际 相连 。 从 20 世纪 70 年 代 早 期 和 中 期 ， 除 ARPAnet 
之 外 的 其 他 分 组 交换 网 络 问 世 : ALOHAnet 是 一 个 微波 网 络 ， 它 将 夏威夷 品 上 的 大 学 
[ Abramson 1970], LIA DARPA 的 分 组 卫星 [RFC 829] 和 分 组 无 线 电 网 [ Kahn 1987] 连 
接 到 一 起 ; Telenet 是 BBN 的 商用 分 组 交换 网 ， 基 于 ARPAnet 技术 ; 由 Louis Pouzin 领衔 的 
Cyclades 是 一 个 法 国 的 分 组 交换 网 [Think 2012]; 如 Tymnet 和 CE 信息 服务 网 这 样 的 分 时 
网 络 ， 以 及 20 世纪 60 年 代 后 期 和 70 年 代 初 期 的 类 似 网 络 [Schwartz 1977]; IBM 的 SNA 
(1996 ~1974)， 它 与 ARPAnet 并 行 工作 | Schwartz 1977 |. 

网 络 的 数目 开始 增加 。 时 至 今日 人 们 看 到 ， 研 制 将 网 络 连接 到 一 起 的 体系 结构 的 时 机 
已 经 成 熟 。 互 联网 络 的 先驱 性 工作 (得 到 了 美国 国防 部 高 级 人 研究 计划 消 (DARPA) 的 文 
持 ) 由 Vinton Cerf 和 Robert Kahn | Cerf 1974 | 完成 ， 本 质 上 就 是 创建 一 个 网 络 的 网 络 ; 术 
语 网 络 互联 (internetting) 就 是 用 来 摘 述 该 项 工作 的 。 

这 些 体系 结构 的 原则 被 具体 表达 在 TCP 协议 中 。 然 而 ，TCP 的 早期 版 本 与 今天 的 TCP 
差异 很 大 。TCP 的 早期 版 本 与 数据 可 徘 的 顺序 传递 相 结 合 ， 经 过 具有 转发 功能 (今天 该 功 
能 由 IP 执行) 的 端 系 统 的 重 传 ( 仍 是 今天 的 TCP 的 一 部 分 )。TCP 的 早期 实验 以 及 认识 到 
对 诸如 分 组 语音 这 样 的 应 用 程序 一 一 一 个 不 可 靠 、 非 流 控制 的 端 到 端 传递 服务 的 重要 性 ， 
SCIP 从 TCP 中 分 离 出 来 ， 并 研制 了 UDP 协议 。 我 们 今天 看 到 的 3 个 重要 的 因特网 协 
IM——TCP, UDP 和 IP， 到 20 世纪 70 年 代 末 在 概念 上 已 经 完成 。 

除了 DARPA 的 因特网 相关 研究 外 ， 许 多 其 他 重要 的 网 络 活动 也 在 进行 中 。 在 夏威夷 ， 
Norman Abramson 正在 研制 ALOHAnet， 这 是 一 个 基于 分 组 的 无 线 电 了 网络， 它 使 在 夏威夷 怠 
上 的 多 个 远程 站 点 互相 通信 。ALOHA 协议 | Abramson 1970」 是 第 一 个 多 路 访问 协议 ， 允 
许 地 理 上 分 布 的 用 户 共 享 单一 的 广播 通信 媒体 (一 个 无 线 电 频率 )。Metcalfe 和 Boggs 基于 
Abramson 的 多 路 访问 协议 ， 癸 制 基 于 有 线 的 共享 广播 网 络 的 以 太 网 协议 Metcalfe 
1976 | 。 令 人 感 兴趣 的 是 ，Metcalfe 和 Boggs 的 以 太 网 协议 是 由 连接 多 台 PC、 打 印 机 和 共 
享 磁盘 在 一 起 的 需求 所 激励 的 [ Perkins 1994 ] 。 在 PC 革命 和 网 络 爆炸 的 25 年 之 前 ，Met- 
calfe 和 Boggs 就 商定 了 今天 PC LAN 的 基础 。 


1.7.3 网 络 的 激增 : 1980 ~ 1990 


到 了 20 世纪 70 年 代 未 ， 大 约 200 台 主 机 与 ARPAnet 相连 。 到 了 20 世纪 80 年 代 ， 连 
到 公共 因特网 的 主机 数量 达到 100 000 台 。20 世纪 80 年 代 是 联网 主机 数量 急剧 增长 的 
时 期 。 

这 种 增长 导致 了 几 个 创建 计算 机 网 络 将 大 学 连接 到 一 起 的 显著 成 果 。BITNET 为 位 于 
美国 东北 部 的 儿 个 大 学 之 间 提 供 了 电子 邮件 和 文件 传输 。 建 立 了 CSNET (计算 机 科学 
网 ) ， 以 将 还 没有 接 入 ARPAnet 的 大 学 研究 人 员 连 接 在 一 起 。1986 年 ， 建 立 了 NSFNET, 
为 NSF 资助 的 超级 计算 中 心 提 供 接 入 。NSFNET 最 初 具有 56kbps 的 主干 速率 ， 到 了 20 tit 
纪 80 年 代 未 ， 它 的 主干 运行 速率 是 1. 5Mbps， 并 成 为 连接 区 域 网 络 的 基本 主干 。 

在 ARPAnet 界 中 ,许多 今天 的 因特网 体系 结构 的 最 终 部 分 逐渐 变 得 清晰 起 来 。1983 
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年 1 月 1 日 见证 了 TCPZAP 作为 ARPAnet 的 新 的 标准 主机 协议 的 正式 部 车， 和 蔡 代 厂 NCP 协 
iM. M NCP F) TCP/IP 的 迁移 | RFC 801] 是 一 个 标志 性 事件 ， 所 有 主机 被 要 求 在 那天 转 
移 到 TCP/IP 上 去 。 在 20 世纪 80 年 代 后 期 ，TCP 进行 了 重要 扩展 ， 以 实现 基于 主机 的 拥 
Jefe Hl [Jacobson 1988 ] 。 还 研制 出 了 DNS (域名 系统 )， 用 于 把 人 可 读 的 因特网 名 字 ( 例 
如 gaia. cs. umass. edu) PRIS BIE AY 32 比特 IP 地 址 | RFC 1034 | - 

在 20 世纪 80 年 代 初 期 ， 在 ARPAnet (这 绝 大 多 数 是 美国 努力 的 成 末 ) 发 展 的 同 
时 ， 法 国 启动 了 Minitel 项 目 ， 这 个 雄心 勃勃 的 计划 是 让 数据 网 络 进 入 每 个 家 硅 。 在 法 
国政 府 的 支持 下 ，Minitel 系统 由 公共 分 组 交换 网 络 (基于 X. 25 协议 集 ) Minitel 服务 
禹 和 具有 内 置 低速 调制 解 调 喜 的 廉价 终端 组 成 。Minitel 于 1984 年 取得 了 巨大 的 成 功 ， 
当时 法 国政 府 癌 每 个 需要 的 住户 免费 分 发 一 个 Minitel 终端 。Minitel 站 点 包括 免费 站 点 
(如 电话 目录 站 点 ) ， 以 及 一 些 专用 站 上 点。 这些 专用 站 点 根据 每 个 用 户 的 使 用 来 收取 费 
FA. 在 20 世纪 90 年 代 中 期 的 易 盛 时 期 Minitel 提供 了 20000 2 AHIR , W iiM KKE R 
行 到 特殊 人 研究 数据 库 的 广泛 范围 。Minitel 在 大 量 法 国家 庭 中 存在 了 10 年 后 ， 大 多 数 美 
国人 才 听 说 因特网 : 


1.7.4 因特网 爆炸 : 20 世纪 90 FR 


20 世纪 90 年 代 出 现 了 许多 标志 因特网 持续 单 命 和 很 快 到 来 的 商业 化 的 事件 。 作 为 因 
特 网 祖先 的 ARPAnet 已 不 复 存 在 。1991 年 ，NSFNET 解除 了 对 NSFNET 用 于 商业 目的 的 限 
制 。NSFNET 自身 于 1995 年 退役 ,这 时 因特网 主干 流量 则 由 商业 因特网 服务 提供 商 负责 

然而 ，20 世纪 90 年 代 的 主要 事件 是 万 维 网 (World Wide Web) 应 用 程序 的 出 现 ， 它 
将 因特网 带 人 世界 上 数 以 百 万 计 的 家 庭 和 企业 中 。Web 作为 一 个 平台 ， 也 引入 和 配置 了 效 
百 个 新 的 应 用 程序 ， 其 中 包括 搜索 (如 谷歌 和 Bing) 、 因 特 网 商务 (如 亚马逊 和 eBay) 和 
社交 网 络 ( 如 脸谱 )， 对 这 些 应 用 程序 我 们 今天 已 经 习 以 为 弟 了 。 

Web 是 由 Tim Berners-Lee F 1989 ~ 1991 年 期 间 在 CERN 发 明 的 [ Berners-Lee 1989 | , 
最 初 的 想法 源 于 20 世纪 40 年 代 Vannevar Bush | Bush 1945] 和 20 世纪 60 年 代 以 来 Ted 
Nelson | Xanadu 2007] 在 超 文 本 方面 的 早期 工作 。Berners- Lee All (ti, AY [a] St th] (| HTML, 
HTTP, Web 服务 器 和 浏览 器 的 初始 版 本 ， 这 是 Web 的 4 个 关键 部 分 。 到 了 1993 年 末 前 
后 ， 大 约 有 200 台 Web 服务 需 在 运行 ， 而 这 些 只 是 正在 出 现 的 Web 服务 融 的 冰山 一 角 。 
就 在 这 个 时 候 ， 几 个 研究 人 员 人 研制 了 有 具有 GUI 接口 的 Web i bi dt, HPAY Mare Andrees- 
sen 和 Jim Clark 一 起 创办 了 Mosaic Communications 公司 ， 该 公司 就 是 后 来 的 Netscape 通信 
公司 [ Cusmano 1998; Quittner 1998], 。 到 了 1995 年 ， 大 学 生 们 每 天 都 在 使 用 Netscape 浏 
览 器 在 Web 上 冲浪 。 大 约 在 这 段 时 间 ， 大 大 小 小 的 公司 都 开始 运行 Web IRA at. FFE 
Web 上 处 理 商 务 。1996 年 ， 微 软 公司 开始 开发 浏览 器 ， 这 导致 了 Netscape 和 微软 之 间 的 
浏览 器 之 战 ， 并 以 微软 公司 在 几 年 后 获胜 而 告终 | Cusumano 1998 | 。 

20 世纪 90 年 代 的 后 5 年 是 因特网 飞速 增长 和 变革 的 时 期 ， 伴 随 着 主流 公司 和 数 以 千 
计 的 后 起 之 秀 创造 因特网 产品 和 服务 。 到 了 2000 年 未 ， 因 特 网 已 经 支持 数 百 流行 的 应 用 
程序 ， 包 括 以 下 4 种 备 受 欢迎 的 应 用 程序 : 

e 电子 邮件 ， 包 括 附件 和 Web 可 访问 的 电子 邮件 。 
e Web, 包括 Web 浏览 和 因特网 商务 。 
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e BIASIH, (instant messaging) ， 有 具有 联系 人 列表 。 

e MP3 AYX} (peer-to-peer) XPH, H Napster 所 领衔 。 

值得 一 提 的 是 ， 前 两 个 应 用 程序 出 目 专 业 人 研究 机 构 ， 而 后 两 个 却 由 一 些 年 轻 创 业者 所 
发 明 。 

1995 ~2001 年 ， 这 上 段 时 间 也 是 因特网 在 金融 市 场 上 急 转 突变 的 时 期 。 在 成 为 有 利 可 图 
的 公司 之 前 ， 数 以 百 计 的 新 兴 因 特 网 公司 徘 首 次 公开 勇 股 (IPO) 并 在 股票 市 场 上 交易 起 
家 。 许 多 公司 身价 数 十 亿美 元 ， 却 没有 任何 主要 的 收入 渠道 。 因 特 网 的 股票 在 2000 ~ 2001 
年 朋 盘 ， 导 致 许多 创业 公司 倒闭 。 不 过 ， 也 有 许多 公司 成 为 因特网 世界 的 大 说 家 ， 包括 微 
软 、 思 科 、 雅 虎 、e-Bay 、 谷 歌 和 亚马逊 。 


1.7.5 最 新 发 展 


计算 机 网 络 中 的 变 音 继续 以 急促 的 步伐 前 进 。 所 有 的 前 沿 人 研究 正在 取得 进展 ， 包 括 部 署 
更 快 的 路 由 顺和 在 接 人 网 和 网 络 主干 中 提供 更 高 的 传输 速率 。 但 下 列 进展 值得 特别 关注 : 

© H 2000 年 开始 ， 我 们 见证 了 家 庭 宽 审 因 特 网 接 和 的 积极 发 展 一 一 人 不仅 有 电缆 调制 
has DSL， 而 且 有 光纤 到 户 ， 这 些 在 1.2 市 中 讨论 过 。 这 种 高 速 因特网 为 丰 
富 的 视频 应 用 创造 了 条 件 ， 包 插 用 户 生 成 的 视频 的 分 发 (例如 YouTube), 电影 和 
电视 节目 流 的 点 播 (例如 Netflix) 和 多 人 视频 会 以 (例如 Skype). 

© 高 速 (54Mbps 及 更 高 ) 公共 Wiki 网 络 和 经 过 3G 和 46G 蜂 坟 电话 网 的 中 速 (高 达 
JL Mbps) 因特网 接 入 越 来 越 普及 ， 不 仪 使 在 运动 中 保持 持续 连接 成 为 可 能 ， 也 产 
生 了 新 型 特定 位 置 服务 。2011 年 ,与 因特网 连接 的 无 线 设备 的 数量 超过 有线 设 
备 的 数量 。 高 速 无 线 接 人 为 手持 计算 机 (iPhone 、 安 时 手机、iPad 等 ) 的 迅速 出 
现 提供 了 舞台 ， 这 些 手 持 计算 机 具有 对 因特网 持续 不 断 和 无 拘束 接 和 人 的 优点 。 

© 诸如 脸谱 和 推 特 (Twitter) 这 样 的 在 线 社交 网 络 已 经 在 因特网 之 上 构建 了 巨大 的 
人 际 网 络 。 许 多 因特网 用 户 今天 主要 “ 活 在 ”脸谱 中 。 通 过 他 们 的 API, Ett 
交 网 络 为 新 的 联网 应 用 和 分 布 式 游戏 创建 了 平台 。 

e 如 在 1.3.3 节 中 所 讨论 的 ， 在线 服 务 提供 商 如 合 歌 和 微软 已 经 部 车 了 自己 的 广汉 的 
专用 网 络 。 该 专用 网 络 不 仅 将 它们 分 布 在 全 球 的 数据 中 心 连接 在 一 起 ， 而 且 通 过 直 
接 与 较 低 层 ISP 对 等 连接 ， 能 够 尽 可 能 绕 过 因特网 。 因 此 ， 合 歌 几 乎 可 以 立即 提供 
搜索 结果 和 电子 邮件 访问 ,仿佛 它们 的 数据 中 心 运行 在 自己 的 计算 机 之 中 一 样 。 

e 许多 因特网 商务 公司 在 “ 云 ”( 如 亚马逊 的 EC2 、 谷 歌 的 应 用 引擎 MER Azure) 
中 运行 它们 的 应 用 。 许 多 公司 和 大 学 也 已 经 将 它们 的 因特网 应 用 (如 电子 邮件 和 
Web 集合 ) 迁移 到 云 中 。 云 公司 不 仅 可 以 为 应 用 提供 可 扩展 的 计算 和 存储 环境 ， 
也 可 为 应 用 提供 对 其 高 性 能 专用 网 络 的 隐 含 访问 。 





1.8 小 结 


在 本 章 中 ,我 们 涉及 了 大 量 的 材料 ! 我 们 已 经 看 到 构成 特别 的 因特网 和 普通 的 计算 机 
网 络 的 各 种 硬件 和 软件 。 我 们 从 网 络 的 边缘 开始 ， 观 察 端 系 统 和 应 用 程序 ， 以 及 运行 在 站 
系统 上 为 应 用 程序 提供 的 运输 服务 。 接 着 我 们 也 观察 了 通常 能 够 在 接 人 网 中 找到 的 链 路 层 
技术 和 物理 媒体 。 然 后 我 们 进入 网 络 核 心 更 深入 地 钻研 网 络 ， 看 到 分 组 交换 和 电路 交换 是 
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全 球 性 因特网 的 结构 ， 知 道 了 因特网 是 网 络 的 网 络 。 我 们 看 到 了 因特网 的 由 较 高 层 和 较 
be ISP 组 成 的 等 级 结构 ， 人 允许 该 网 络 扩展 为 包括 数 以 千 计 的 网 络 ， 

在 这 个 概述 性 一 曹 的 第 二 部 分 ， 我 们 研究 了 了 计算 机 网 络 领域 的 几 个 重要 主题 。 我们 
首先 研究 了 分 组 交换 网 中 的 时 延 、 乔 吐 量 和 丢 包 的 原因 。 我 们 研究 得 到 传输 、 传 播 和 排 
队 时 延 以 及 用 于 在 吐 量 的 简单 定量 模型 ; 我 们 将 在 整 本 书 的 课 后 习题 中 多 处 使 用 这 些 时 
延 模型 。 接 下 来 ， 我 们 研究 了 协议 分 层 和 服务 模型 、 联 网 中 的 关键 体系 结构 原则 ， 我 们 
将 在 本 书 多 处 引用 它们 ， le a a, 我 
们 用 计算 机 网 络 的 简要 历史 结束 我 们 对 网 络 的 概述 。 第 1 章 本 身 就 构成 了 计算 机 网 络 的 
小 型 课程 . 

因此 , 第 1 章 中 的 确 涉 及 了 大 量 的 背景 知识 ! 如 果 你 有 些 不 知 所 云 ， 请 不 要 着 急 。 在 
后 继 几 草 中 我 们 将 重新 回顾 这 些 概念 ， 更 为 详细 地 研究 它们 〈 那 是 承诺 ， 而 不 是 威胁 !) - 
此 时 ， 我 们 和 希望 你 完成 本 草 内 容 的 学 习 时 ， 对 构建 网 络 的 众多 元 系 的 直觉 越 来 越 敏 锐 ， 对 
网 络 词 汇 越 来 越 精通 (不 妨 经 滑 回 过 头 来 查阅 本 音 ) ， 对 更 加 次 和 人 地 学 习 网 络 的 愿望 越 来 
越 强 烈 。 这 些 也 是 在 本 书 的 其 余部 分 我 们 将 面临 的 任务 ， 


本 书 的 路 线 图 


在 开始 任何 旅行 之 前 ， 你 总 要 先 察 看 路 线 图 ， 以 便 更 为 熟悉 前 面 的 主要 道路 和 交界 
处 。 对 于 我 们 即将 开 ee “旅行 ”而 言 ， 其 最 终 目 的 地 是 深入 理解 计算 机 网 络 “ 是 
什么 、 怎 么 样 和 为 什么 ”等 内 容 。 我 们 的 路 线 图 是 本 书 各 草 的 顺序 : 

第 | 计算 机 网 络 和 因特网 

第 2 应 用 层 

第 3 运输 层 

第 4 网 络 层 

第 5 链 路 层 : 链 路 、 接 入 网 络 和 局 域 网 

第 6 无 线 网 络 和 移动 网 络 

第 7 多 媒体 网 络 

第 8 计算 机 网 络 中 的 安全 

第 9 网 络 管理 

从 第 2 章 到 第 S 章 是 本 书 的 4 个 核心 草 。 应 当 注 意 的 是 ， 这 些 童 都 围绕 5 层 因 特 网 协 
议 栈 上 面 的 4 层 而 组 织 ， 其 中 一 章 对 应 一 层 。 进 一 步 要 注意 的 是 ,我 们 的 旅行 将 从 因特网 
协议 栈 的 顶部 ， 即 应 用 层 开始 ， 然 后 问 下 面 各 层 进 行 学 习 。 这 种 自 顶 癌 下 旅行 痛 后 的 基本 
原理 是 ， 一 旦 我 们 理解 这 些 应 用 程序 ， 就 能 够 理解 支持 这 些 应 用 程序 所 需 的 网 络 服务 。 然 
后 能 够 依次 研究 由 网 络 体系 结构 可 能 实现 的 服务 的 各 种 方式 。 较 早 地 涉及 应 用 程序 ， 也 能 
够 对 学 习 本 课程 其 余部 分 提供 动力 。 

第 6 划 到 第 9 间 关 注 现 代 计 算 机 网 络 中 的 4 个 极为 重要 的 (并 且 在 某 种 程度 上 是 独立 
的 ) 主题 。 在 第 6 草 中 ， 我 们 人 研究 了 无 线 网 络 和 移动 网 络 ， 包 括 无 线 LAN (其 中 有 Wiki 
和 蓝牙 ) 、 蜂 帘 电话 网 (包括 GSM、3G 和 4C) 和 (在 IP 网 络 和 GSM 网 络 中 的 ) 移动 性 。 
在 第 7 章 中 ,我们 研究 了 音频 和 视频 应 用 ,例如 因特网 电话 、 视 频 会 议和 流 式 存储 媒体 . 
此 外 ， 还 讨论 如 何 设计 分 组 交换 网 络 以 对 音频 和 视频 应 用 程序 提供 一 致 的 服务 质量 。 在 第 
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8 草 中 ， 我 们 首先 学 习 加 密 和 网 络 安全 的 基础 知识 ， 然 后 研究 基础 理论 如 何 应 用 于 因特网 
环境 的 不 同情 况 。 最 后 一 革 (第 9 BE) 研究 网 络 管理 中 的 关键 问题 以 及 网 络 管理 中 使 用 的 
主要 因特网 协议 。 


课 后 习题 和 问题 





R1.“ 主 机 ”和 “ 端 系统 ”之 间 有 什么 不 同 ?” 列 举 几 种 不 同类 型 的 端 系统 。Web 服务 器 是 一 种 端 系统 吗 ? 

R2. “协议 ”一 词 常 被 用 于 描述 外 交 关 系 。 维 基 百 科 是 怎样 描述 外 交 协 议 的 ? 

R3. 标准 对 于 协议 为 什么 重要 ? 

1.2 节 

R4. 列 出 6 种 接 入 技术 。 将 它们 分 类 为 住宅 接 和信 、 公 司 接 入 或 广 域 无 线 接 入 ， 

RS. HFC 带宽 是 专用 的 ， 还 是 用 户 间 共享 的 ?在 下 行 HFC 信道 中 ， 有 可 能 发 生 碰 撞 吗 ? 为什么? 

R6. 列 出 你 所 在 城市 中 的 可 供 使 用 的 住宅 接 人 技术 。 对 于 每 种 类 型 的 接 人 方式， 给 出 所 宣称 的 下 行 速 率 、 
上 行 速 率 和 每 月 的 价格 。 

R7. 以 太 LAN 的 传输 速率 是 多 少 ? 

R8. 能 够 运行 以 太 网 的 一 些 物理 媒体 是 什么 ? 

R9. es Val ll EDA | HFC. DSL 和 FTTH 都 用 于 住宅 接 人 。 对 于 这 些 技术 中 的 每 一 种 ， 给 出 传输 速率 的 
范围 、 并 讨论 有 关 珊 宽 是 共享 的 还 是 专用 的 。 

R10. 描述 今天 最 为 流行 的 无 线 因特网 接 入 技术 。 对 它们 进行 比较 和 对 照 。 

1.3 节 

RIL 假定 在 发 送 主机 和 和 接收 主机 间 只 有 一 台 分 组 交换 机 。 发 送 主机 和 交换 机 间 以 及 交换 机 和 接收 主机 间 
的 传输 速率 分 别 是 RR 和 R,。 假 设 该 交换 机 使 用 存储 转发 分 组 交换 方式 ,发 送 一 个 长 度 为 L 的 分 组 
AY sina BU aig EAT UE ETA? (忽略 排队 时 延 、 传 播 时 延 和 处 理 时 延 。) 

R12. 与 分 组 交换 网 络 相 比 ， 电 路 交换 网 络 有 哪些 优点 ?在 电路 交换 网 络 中 ，TDM 比 FDM 有 哪些 优点 ? 

R13. 假定 用 户 共 享 一 条 2Mbps 链 路 。 同 时 假定 当 每 个 用 户 传输 时 连续 以 1Mbps 传输 ， 但 每 个 用 户 仅 传 输 
20% 的 时 间 。 
a. 当 使 用 电路 交换 时 ， 能 够 支持 多 少 用 户 ? 
b. 作为 该 题 的 遗留 问题 ， 假 定 使 用 分 组 交换 。 为 什么 如 果 两 个 或 更 少 的 用 户 同 时 传输 的 话 ， 在 链 

路 前 面 基本 上 没有 排队 时 延 ? 为 什么 如 果 3 个 用 户 同 时 传输 的 话 ， 将 有 排队 时 延 ? 
c 求 出 某 指定 用 户 正在 传输 的 概率 。 
d. 假定 现在 有 3 个 用 户 。 求 出 在 任何 给 定 的 时 间 ， 所 有 3 个 用 户 在 同时 传输 的 概率 。 求 出 队列 增长 
的 时 间 比 率 。 

R14. 为 什么 在 等 级 结构 相同 级 别 的 两 个 ISP 通常 互相 对 等 ?” 某 IXP 是 如 何 挣 钱 的 ? 

RIS. 某 些 内 容 提 供 商 构建 了 自己 的 网 络 。 描 述 谷歌 的 网 络 。 内 容 提 供 商 构建 这 些 网 络 的 动机 是 什么 ? 

1.4 节 

R16. 考虑 从 某 源 主机 跨越 一 条 固定 路 由 向 某 目 的 主机 发 送 一 分 组 。 列 出 端 到 端 时 延 中 的 时 延 组 成 成 分 。 
这 些 时 延 中 的 哪些 是 固定 的 ， 哪 些 是 变化 的 ? 

R17. 访问 在 配套 Web 网 站 上 有 关 传 输 时 延 与 传播 时 延 的 Java 小 程序 。 在 可 用 速率 、 传 播 时 延 和 可 用 的 
分 组 长 度 之 中 找 出 一 种 组 合 ， 使 得 该 分 组 的 第 一 个 比特 到 达 接 收 方 之 前 发 送 方 结束 了 传输 。 找 出 另 
一 种 组 合 ， 使 得 发 送 方 完 成 传输 之 前 ， 该 分 组 的 第 一 个 比特 到 达 了 接收 方 。 
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R18. 一 个 长 度 为 1000 字 节 的 分 组 经 距离 2500km 的 链 踏 传播 ， 传 播 速率 为 2.5 x 10 ms 并 且 传 输 速 : 
pe 它 需 要 用 多 长 时 间 ?7 更 为 一 一 个 长 度 为 上 的 分 组 经 中 离 为 4d 的 链 路 传播 ， oes 


名 为 JPA fea RAN R bps, Eih the prn ? 该 时 延 与 传输 速率 由 关 吗 ? 

R19. pene A 要 向 主机 B 发 送 一 个 大 文件 ， 从 主机 A 到 主机 BME LA 3 段 链 路 ， 其 速率 分 别 为 
R, =500kbps, R, =2Mbps, R, =1Mbps_ 
a POER PA Hai. POE EY Fe NUE gy? 
b. 假定 该 文件 为 4MB。 传输 该 文件 到 主机 BAR BE 2S Ka? 
co 重复 (a) 和 (b)， 只 是 这 时 R, 减 小 到 100kbps. 

R20. 假定 端 系统 A BE iman B RA TPA IE TE PARK E. WE m FREE AE AK SCPE 
成 分 组 。 当 这 些 分 组 之 一 到 达 某 分 组 交换 机 时 ， 该 交换 机 使 用 分 组 中 的 什么 信息 来 决定 将 该 分 组 转 
发 到 哪 一 条 链 路 上 ? 因特网 中 的 分 组 交换 为 什么 可 以 与 驱车 从 一 个 城市 到 另 一 个 城市 并 沿途 询问 方 
ln] FA e? 

R21. 访问 配套 Web 站 点 的 排队 和 丢 包 Java 小 程序 。 最 大 发 送 速 率 和 最 小 的 传输 速率 是 多 少 ” 对 于 这 些 
速率 ， 流 量 强 度 是 多 少 ” 用 这 些 速率 运行 该 Java 小 程序 并 确定 出 现 丢 包 要 化 费 多 长 时 间 ? 然后 第 二 
次 重复 该 实验 ， 贞 次 确定 出 现 丢 包 花 费 多 长 时 间 - 这 些 值 有 什么 不 同 ” 为 什么 会 有 这 种 现象 ? 

LSB 

R22， 列 出 一 个 层次 能 够 执行 的 5 个 任务 。 这 些 任务 中 的 一 个 (或 两 个 ) 可 能 由 两 个 (或 更 多 ) 层次 执 
fynu ? 

R23. 因特网 协议 栈 中 的 5 个 层次 有 哪些 ? 在 这 些 层次 中 ， 每 层 的 主要 任务 是 什么 

R24. 什么 是 应 用 层 报 文 ?” 什 么 是 运输 层 报 文 段 y 什么 是 网 络 层 数据 报 ?” 什 么 是 链 路 层 帧 ? 

R25. 路 由 费 处 理 因特网 协议 栈 中 的 哪些 层次 ? 链 路 层 交 换 机 处 理 的 是 哪些 层次 ?主机 人 处理 的 是 哪些 层次 ? 

1.6 $ 

R26. 病毒 和 蠕虫 之 间 有 什么 不 同 ? 

R27. 描述 如 何 产 生 一 个 从 尸 网 络 ， 以 及 僵尸 网 络 是 怎样 被 用 于 DDoS 攻击 的 ， 

R28. 假定 Alice 和 Bob 经 计算 机 网 络 互 相 发 送 分 组 、 假定 Trudy 将 自己 安置 在 网 络 中 ， 使 得 她 能 够 俘获 由 
Alice 发 送 的 所 有 分 组 ， 并 发 送 她 希望 给 Bob 的 东西 ; 她 也 能 够 俘获 由 Bob 发 送 的 所 有 分 组 ， 并 发 
送 她 希望 给 Alice 的 东西 。 列 出 在 这 种 情况 下 Trudy 能 够 做 的 某 些 恶意 的 事情 . 


Pl. 设计 并 描述 在 日 动 柜员 机 和 银行 的 中 央 计 算 机 之 间 使 用 的 一 种 应 用 层 协 议 . 你 的 协议 应 当 多 许 验 证 
用 户 卡 和 口令 ， 查 询 账 目 结算 (这些 部 在 中 央 计 算 机 系统 中 进行 维护 )， 支 取 账 目 ( 即 向 用 户 文 付 
钱 ) 你 的 协议 实体 应 当 能 够 处 理 取 钱 时 账目 中 钱 不 够 的 常见 问题 。 通 过 列 出 自动 柜员 机 和 银行 中 央 
计算 机 在 报 文 传输 和 接收 过 程 中 交换 的 报 文 和 采取 的 动作 来 定义 你 的 协议 。 使 用 类 似 于 图 1-2 所 示 
的 图 ， 拟 定 在 简单 无 差错 取 钱 情况 下 该 协议 的 操作 。 明 确 地 曾 述 在 该 协议 中 关于 底层 端 到 端 运输 服 
务 所 作 的 假设 . 

P2. 式 (1-1) 给 出 了 经 传输 速率 为 R 的 必 段 链 路 发 送 长 度 上 的 一 个 分 组 的 端 到 端 时 延 。 对 于 经 过 入 上 段 链 
路 连续 地 发 送 P 个 这 样 的 分 组 ， 一般 化 地 表示 出 这 个 公式 。 

P3. 考虑 一 个 应 用 程序 以 稳定 的 速率 传输 数据 ( 例如， 发送 方 每 k 个 时 间 单 元 产生 一 个 改 比特 的 数据 音 
元 ， 其 中 大 较 小 且 固 定 ) 。 另 外 ， 当 这 个 应 用 程序 启动 时 ， 它 将 连续 运行 相当 长 的 一 段 时 间 。 回 答 下 
列 问题 ， 简 要 论证 你 的 回答 
a. 是 分 组 交换 网 还 是 电路 交换 网 更 为 适合 这 种 应 用 ”为 什么 ? 
b. 假定 使 用 了 分 组 交换 网 ， 并 且 该 网 中 的 所 有 流量 都 来 自如 上 所 述 的 这 种 应 用 程序 。 此 外 ， 假 定 该 

应 用 程序 数据 传输 速率 的 总 和 小 于 每 条 链 路 的 各 自 容量 。 需要 某 种 形式 的 拥塞 控制 吗 ” 为 什么 ? 
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BIETER] 1-13 中 的 电路 交换 网 ， 回 想 在 每 条 链 路 上 有 4 条 链 路 ， 以 顺 时 针 方 向 标记 四 台 交 换 机 A、 

B、C ALD, 

a. 在 该 网 络 中 ， 任 何 时 候 能 够 进行 同时 连接 的 最 大 数量 是 多 少 ? 

b. 假定 所 有 连接 位 于 交换 机 A 和 C 之 间 。 能够 进行 同时 连接 的 最 大 数量 是 多 少 ? 

co 假定 我 们 要 在 交换 机 A ALC 之 间 建 立 4 条 连接 ， 在 交换 机 BALD 之 间 建 立 男 外 4 条 连接 ,我 们 能 
够 让 这 些 呼叫 通过 这 4 条 链 路 建立 路 由 以 容纳 所 有 8 条 连接 吗 ? 


-回顾 在 1.4 节 中 的 车 队 的 类 比 。 假定 传播 速度 还 是 100km/h, 


a 假定 车 队 旅 行 150km: 在 一 个 收费 站 前 面 开始 ,通过 第 二 个 收费 站 ， 并 且 在 第 三 个 收费 站 后 面 结 
束 。 其 端 到 端 时 延 是 多 少 ? 
b 重复 (a) ， 现 在 假定 车 队 中 有 8 辆 汽车 而 不 是 10 辆 。 


. 这 个 习题 开始 探讨 传播 时 延 和 传输 时 延 ， 这 是 数据 网 络 中 的 两 个 重要 概念 。 考虑 两 台 主 机 A M B 由 


一 条 速率 为 R bps 的 链 路 相连 。 假定 这 两 台 主 机 相隔 普米 ， 沿 该 链 路 的 传播 速率 为 * m/s. 主机 A 向 
主机 B 发 送 长 度 上 比特 的 分 组 ， 

a. H om 和 ss 来 表示 传播 时 延 dorpe 

h. 用工 和 RR 来 确定 该 分 组 的 传输 时 间 dyan, 


c 忽略 处 理 和 排队 时 延 ， 得 出 端 到 端 时 延 的 表达 式 ， 

d. 假定 主机 A 在 时 刻 1=0 开始 传输 该 分 组 。 在 时 刻 1=d,,,.， 该 分 组 的 最 后 一 个 比特 在 什么 地 方 ? 
e. 假定 diy KF dua 。 在 时 刻 1=d,,,， 该 分 组 的 第 一 个 比特 在 何 处 ? 

f 假定 小 于 di,.。 在 时 刻 1=d,,,.， 该 分 组 的 第 一 个 比特 在 何 处 ? 

g 假定 s=2.5x10 , L=120 比特 ，R =56kbps。 求 出 使 dr EF di 的 距离 Mm, 


.在 这 个 习题 中 ， 我 们 考虑 从 主机 A 向 主机 B 通过 分 组 交换 网 发 送 语 音 ( VolP)。 主 机 A 将 模拟 语音 


转换 为 传输 中 的 64kbps 数字 比特 流 。 然 后 主机 A 将 这 些 比 特 分 为 56 字 节 的 分 组 ,A 和 B 之 间 有 一 条 
链 路 : 它 的 传输 速率 是 2Mbps， 传播 时 延 是 10ms, 一旦 A 收集 了 一 个 分 组 ， 就 将 它 向 主机 B 发 送 。 
一 旦 主机 B 接收 到 一 个 完整 的 分 组 ， 它 将 该 分 组 的 比特 转换 成 模拟 信号 .从 比特 产生 (从 位 于 主机 
A 的 初始 模拟 信号 起 ) 的 时 刻 起 ， 到 该 比特 被 解码 (在 主机 B 上 作为 模拟 信号 的 一 部 分 ) ， 花 了 多 少 
时 间 ? 


.假定 用 户 共享 一 条 3Mbps 的 链 路 。 又 设 每 个 用 户 传 输 时 要 求 130kbps， 但 是 每 个 用 户 仅 有 10% 的 时 间 


传输 ，( 参见 1.3 节 中 关于 “分 组 交换 与 电路 交换 的 对 比 ” 的 讨论 ,) 

a， 当 使 用 电路 交换 时 ， 能 够 支持 多 少 用 户 ? 

.对 于 本 习题 的 后 续 小 题 ， 假 定 使 用 分 组 交换 。 求 出 给 定 用 户 正 在 传输 的 概率 . 

c 假定 有 120 FHP. 求 出 在 任何 给 定时 刻 ， 实 际 有 个 用 户 在 同时 传输 的 概率 。( 提示 : 使 用 二 项 
式 分 布 .) 

d. 求 出 有 21 个 或 更 多 用 户 同时 传输 的 概率 . 


一 
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-者 虑 在 1.3 节 “ 分 组 交换 与 电路 交换 的 对 比 ” 的 讨论 中 ,给 出 了 一 个 具有 一 条 1Mbps 链 路 的 例子 。 


用 户 在 忙 时 以 100kbps 速率 产生 数据 ， 但 忙 时 仅 以 p =0.1 的 概率 产生 数据 。 假定 用 1Gbps 链 路 替代 
1 Mbps 的 链 路 。 

a. 当 来 用 电路 交换 技术 时 ， 能 被 同时 支持 的 最 大 用 户 数 量 N 是 多 少 ? 

b. 现在 考虑 分 组 交换 和 有 M 个 用 户 的 情况 。 给 出 多 于 NN 用 户 发 送 数 据 的 概率 公式 (Ap. M,N 表示 )， 


PIO. 考虑 一 个 长 度 为 上 的 分 组 从 端 系 统 A 开始 ， 经 3 段 链 路 传送 到 目的 端 系 统 。 令 d, 、s, MR, 表示 链 路 


i 的 长 度 、 传 播 速度 和 传输 速率 (i=1， 2，3)。 该 分 组 交换 机 对 每 个 分 组 的 时 延 为 dyo BEBA 
排队 时 延 ， 根据 d,、s,、R,(i=1, 2, 3) 和 LL， 该 分 组 总 的 端 到 端 时 延 是 什么 ?现在 假定 该 分 组 是 
1500 字 节 ， 在 所 有 3 条 链 路 上 的 传播 时 延 是 2.5 x 108m/s， 所 有 3 条 链 路 的 传输 速率 是 2Mbps， 分 
组 交换 机 的 处 理 时 延 是 3ms， 第 一 段 链 路 的 长 度 是 5000km， 第 二 段 链 路 的 长 度 是 4000km， 并 且 最 
后 一 段 链 路 的 长 度 是 1000km。 对 于 这 些 值 ， 该 端 到 端 时 延 为 多 少 ? 
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在 上 述 习 题 中 ,假定 RR, =R, =R =R Ad, =0。 进 一 步 假 定 该 分 组 交换 机 不 人 存储 转发 分 组 ， 而 是 

在 等 待 分 组 到 达 前 立即 传输 它 收 到 的 每 个 比特 。 这 时 端 到 端 时 延 为 多 少 ? 

一 人 台 分 组 交换 机 接收 一 个 分 组 并 决定 该 分 组 应 当 转 发 的 出 链 路 。 当 某 分 组 到 达 时 ， 男 一 个 分 组 正在 

该 出 链 路 上 被 发 送 到 一 半 ， 还 有 4 个 其 他 分 组 正 等 竺 传输， 这 些 分 组 以 到 达 的 次 序 传 输 。 假定 所 有 

分 组 是 1500 字 节 并 且 链 路 速率 是 2Mbps。 该 分 组 的 排队 时 延 是 多 少 ” 在 更 一 般 的 情况 下 ， 当 所 有 分 

组 的 长 度 是 LL， 传输 速率 是 RR， 当 前 正在 传输 的 分 组 已 经 传输 了 x 比特 ， 并 且 已 经 在 队列 中 有 个 

分 组 ， 其 排队 时 延 是 多 少 ? 

a. 假定 有 w 个 分 组 同时 到 达 一 条 当前 没有 分 组 传输 或 排队 的 链 路 。 每 个 分 组 长 为 上 ， 链 路 传输 速率 

AR. Xt N 个 分 组 而 言 ， 其 平均 排队 时 政 是 多 少 ? 

b. 现在 假定 每 隔 LN/R BOAR N 个 分 组 同时 到 达 链 路 。 一 个 分 组 的 平均 排队 时 延 是 多 少 ? 

考虑 路 由 费 缓 存 中 的 排队 时 延 。 令 1 表示 流量 强度 ; 即 1= La/R， 假定 排队 时 延 的 形式 为 IROA -1), 

其 路 <1、 

a. 写 出 总 时 延 公式 ， 即 排队 时 延 加 上 传输 时 延 . 

b. 以 LZR 为 限 数 画 出 总 时 延 的 图 ， 

a 表示 在 一 条 链 路 上 分 组 的 到 达 率 (以 分 组 / 秒 计 ) ， 令 人 表示 一 条 链 路 上 分 组 的 传输 率 (以 分 

组 / 秒 计 )。 基 于 上 述 习 题 中 推导 出 的 总 时 延 公 式 〈 即 排队 时 延 加 传输 时 延 ) ， 推 导出 以 和 和 人 表示 

的 总 时 延 公式 。 

其 虑 一 - 台 路 由 器 缓存 前 面 的 一 条 出 链 路 。 在 这 个 习题 中 ,将 使 用 李 特 尔 (Liwe) 公式 ， 这 是 排队 论 

中 的 一 个 著名 公式 。 令 表示 在 缓存 中 的 分 组 加 上 被 传输 的 分 组 的 平均 数 。 令 a 表示 到 达 链 路 的 分 

HERK., S d 表示 一 个 分 组 历经 的 平均 总 时 延 ( 即 排队 时 延 加 传输 时 延 )。 李 特 尔 公式 是 N=a xd. 

假定 该 缓存 平均 包含 10 个 分 组 ， 并 且 平 均 分 组 排队 时 延 是 10ms。 该 链 路 的 传输 速率 是 100 分 组 / 

秒 。 使 用 李 特 尔 公 式 ， 在 没有 丢 包 的 情况 下 . 平均 分 组 到 达 率 是 多 少 ? 

a 对 于 不 同 的 处 理 速 率 、 传 输 速 率 和 传播 时 延 ， 给 出 1.4.3 节 中 式 (1-2) 的 一 般 表 达 式 . 

b 重复 (a) ,不 过 此 时 假定 在 每 个 结 点 有 平均 排队 时 延 d,，,.， 

在 一 天 的 3 个 不 同 的 小 时 内 ， 在 同一 个 大 陆 上 的 源 和 目的 地 之 间 执 行 Traceroute. 

a， 在 这 3 个 小 时 的 每 个 小 时 中 ， 求 出 往返 时 延 的 均值 和 方差 。 

b. 在 这 3 个 小 时 的 每 个 小 时 中 ,， 求 出 路 径 上 的 路 由 器 数量 。 在 这 些 时 段 中 ， 该 路 径 发 生变 化 了 吗 ? 

c 试图 根据 源 到 目的 地 Traceroute 分 组 通过 的 情况 ， 辨 明 ISP 网 络 的 数量 。 具 有 类 似 名 字 和 /或 类 似 
AJ IP 地 址 的 路 由 器 应 当 被 认为 是 同一 个 ISP 的 一 部 分 。 在 你 的 实验 中 ,在 相 邻 的 ISP 间 的 对 等 接 
口 处 出 现 最 大 的 时 延 了 吗 ? 

d. 对 位 于 不 同 大 陆 上 的 源 和 目的 地 重复 上 述 内 容 。 比 较 大 陆 内 部 和 大 陆 之 间 的 这 些 结 果 . 

a 访问 站 点 www. traceroute. org， 并 从 法 国 两 个 不 同 的 城市 向 位 于 美国 的 相同 的 目的 主机 执行 Traceroute 
在 这 两 个 Traceroute 中 ， 有 多 少 条 链 路 是 相同 的 ?大 西洋 沿岸 国家 的 链 路 相同 玛 ? 

. 重复 (a) ， 但 此 时 选择 位 于 法 国 的 一 个 城市 和 位 于 德国 的 另 一 个 城市 。 

o 在 美国 挑选 一 个 城市 ， 然 后 向 位 于 中 国 的 两 个 不 同城 市 的 主机 执行 Traceroute。 在 这 两 次 Traceroute 
中 有 和 多少 链 路 是 相同 的 ”在 到 达 中 国 前 这 两 个 Traceroute 分 开 了 吗 ? 
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.考虑 对 应 于 图 1-20b 吞吐 量 的 例子 。 现 在 假定 有 M 对 客户 - 服务 器 而 不 是 10 对 。 用 R.、R. 和 RR 分 


别 表 示 服 务 器 链 路 、 客 户 链 路 和 网 络 链 路 的 速率 。 假 设 所 有 的 其 他 链 路 都 有 充足 容量 ， 并且 除了 由 
这 1M 对 客户 -服务 器 产生 的 流量 外 ， 网 络 中 没有 其 他 流量 。 推 导出 由 R. Ro RAM 表示 的 通用 
Fy ltt tet FEA TK 


. 考虑 图 1-19b。 现 在 假定 在 服务 器 和 客户 之 间 有 4 条 路 径 ， 任 两 条 路 径 部 不 共享 任何 链 路 。 路 径 


kK(k=1, =, M) 是 由 传输 速率 为 RR、R;、…、Rw 的 N 条 链 路 组 成 。 如 果 服 务 器 仅 能 够 使 用 一 条 
路 径 向 客户 发 送 数据 ， 则 该 服务 器 能 够 取得 的 最 大 吞吐 量 是 多 少 ? 如 果 该 服务 器 能 够 使 用 所 有 M R 
路 径 发 送 数据 ， 则 该 服务 硕 能 够 取得 的 最 大 厨 吐 量 是 多 少 ? 
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考虑 图 1-19b 假定 服务 此 与 客户 之 间 的 每 条 链 路 的 丢 包 概率 为 p， 且 这 些 链 路 的 丢 包 率 是 独立 的 . 

一 个 〈 由 服务 器 发 送 的 ) 分 组 成 功 地 被 接收 方 收 到 的 概率 是 多 少 ?” 如 果 在 从 服务 器 到 客户 的 路 径 上 

分 组 丢失 了 ， 则 服务 器 将 重 传 该 分 组 . 平均 来 说 ， 为 了 使 客户 成 功 地 接收 该 分 组 ， 服 务 器 将 要 重 传 

该 分 组 多 少 次 ? 

ER 1-19a。 假 定 我 们 知道 沿 着 从 服务 器 到 客户 的 路 径 的 瓶颈 链 路 是 速率 为 R.bps 的 第 一 段 链 路 . 

假定 我 们 从 服务 问 向 客户 发 送 紧 接着 的 一 对 分 组 ， 且 沿 这 条 路 径 没 有 其 他 流量 。 假 定 每 个 分 组 的 长 

度 为 了 比特 ,两 条 链 路 具有 相同 的 传播 时 延 d,,,。 

a. 在 目的 地 ， 分 组 的 到 达 间 隔 时 间 有 多 大 ? 也 就 是 说 ， 从 第 一 个 分 组 的 最 后 一 个 比特 到 达到 第 二 个 
分 组 最 后 一 个 比特 到 达 所 经 过 的 时 间 有 多 长 ? 

. 现在 假定 第 二 段 链 路 是 瓶颈 链 路 ( 即 R. < R.)。 第 二 个 分 组 在 第 二 段 链 路 输入 队列 中 排队 是 可 能 
的 吗 ? 请 解释 上 原因。 现在 假定 服务 器 在 发 送 第 一 个 分 组 了 秘 之 后 再 发 送 第 二 个 分 组 。 为 确保 在 第 
二 段 链 路 之 前 没有 排队 ，7 必须 要 有 多 长 ?》 试 解释 原因 。 

假设 你 布 望 从 波士顿 到 洛杉矶 紧急 传送 40 x 10° 字 节 数据 ， 你 有 一 条 100Mbps 专用 链 路 可 用 于 传输 

数据 。 你 是 愿意 通过 这 条 链 路 传输 数据 ， 还 是 愿意 使 用 FedEx 一 夜 快递 ”解释 你 的 理由 。 

假定 两 台 主 机 A 和 B 相隔 20 000km， 由 一 条 直接 的 尺 =2Mbps 的 链 路 相连 。 假 定 跨越 该 链 路 的 传播 

速率 是 2.5 x 10° m/s. 

a. 计算 带宽 - 时 延 积 尺 .vs 

b. 考虑 从 主机 A 到 主机 B 发 送 一 个 800 000 比特 的 文件 ,假定 该 文件 作为 一 个 大 的 报 文 连续 发 送 。 
在 任何 给 定 的 时 间 ， 在 链 路 上 具有 的 比特 数量 最 大 值 是 多 少 ? 

c 给 出 带宽 - 时 延 积 的 一 种 解释 。 

d. 在 该 链 路 上 一 个 比特 的 宽度 (以 米 计 ) BAD? 它 比 一 个 足球 场 更 长 吗 ? 

e 根据 传播 速率 *、 市 宽 尺 和 链 路 普 的 长 度 ， 推 导出 一 个 比特 宽度 的 一 般 表 示 式 。 

对 于 习题 P25 ， 假 定 我 们 能 够 修改 R。 对 什么 样 的 R 值 ， 一 个 比特 的 宽度 能 与 该 链 路 的 长 度 一 样 长 ? 

考虑 习题 P25 ,但 现在 链 路 的 速率 是 R=1Gbps。 

a 计算 市 宽 — AREA Rd... 

b. 考虑 从 主机 A 到 主机 B 发 送 一 个 800 000 比特 的 文件 。 假 定 该 文件 作为 一 个 大 的 报 文 连 续 发 送 。 
在 任何 给 定 的 时 间 ， 在 链 路 上 具有 的 比特 数量 最 大 值 是 多 少 ? 

c. 在 该 链 路 上 一 个 比特 的 宽度 (以 米 计 ) 是 多 少 ? 

再 次 考虑 习题 P25., 

a. 假定 连续 发 送 ， 发 送 该 文件 需要 多 长 时 间 ? 

b. 假定 现在 该 文件 被 划分 为 20 个 分 组 ， 每 个 分 组 包含 40 000 比特 。 假 定 每 个 分 组 被 接收 方 确认 ， 
确认 分 组 的 传输 时 间 可 忽略 不 计 。 最 后 ， 假 定 前 一 个 分 组 被 确认 后 ， 发 送 方才 能 发 送 分 组 。 发 送 
该 文件 需要 多 长 时 间 ? 

c 比较 (a) 和 (b) 的 结果 。 

假定 在 同步 卫星 和 它 的 地 球 基站 之 间 有 一 条 10Mbps 的 微波 链 路 。 每 分 钟 该 卫星 拍摄 一 幅 数 字 照 片 ， 

并 将 它 发 送 到 基站 。 假 定 传播 速率 是 2.4 x 10 m/s, 

a. 该 链 路 的 传播 时 延 是 多 少 ? 

b. 带宽 -时 延 积 Rd 是 多 少 ? 

e 在 x 表 示 该 照片 的 大 小 。 对 于 这 条 微波 链 路 ， 能 够 连续 传输 的 * 最 小 值 是 多 少 ? 

考虑 1.5 节 中 我 们 在 分 层 讨 论 中 对 航线 旅行 的 类 比 ， 随 着 协议 数据 单元 向 协议 栈 底层 流动 ， 首 部 在 

增加 。 随 着 旅客 和 行李 移动 到 航线 协议 栈 底 部 ， 有 与 上 述 首 部 信息 等 价 的 概念 吗 ? 

在 包括 因特网 的 现代 分 组 交换 网 中 ， 源 主机 将 长 应 用 层 报 文 (如 一 个 图 像 或 音乐 文件 ) 分 段 为 较 小 

的 分 组 并 向 网 络 发 送 。 接 收 方 则 将 这 些 分 组 重新 装配 为 初始 报 文 。 我 们 称 这 个 过 程 为 报 文 分 段 。 

图 1-27 显示 了 一 个 报 文 在 报 文 不 分 段 或 报 文 分 段 情况 下 的 端 到 端 传输 。 考 虑 一 个 长 度 为 8 x10` EL 
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特 的 报 文 ， 它 在 网 1-27 中 从 源 发 送 到 目的 地 。 假 定 在 该 图 中 的 每 段 链 路 是 2Mbps。 metit. HEA 
和 处 理 时 延 ， 










源 分 组 交换 机 分 组 交换 机 目的 地 
a) 没有 报 文 分 段 





分 组 交换 机 分 组 交换 机 
b) 有 报 文 分 段 
图 1-27 端 到 端 报 文 传输 


a. 考虑 从 源 到 目的 地 发 送 该 报 文 且 没有 报 文 分 段 。 从 源 主机 到 第 一 台 分 组 交换 机 移动 报 文 震 要 多 长 时 
间 ? 记 住 ， 每 台 交 换 机 均 使 用 存储 转发 分 组 交换 ， 从 源 主机 移动 该 报 文 到 目的 主机 需要 多 长 时 间 ” 
b. 现在 假定 该 报 文 被 分 段 为 800 个 分 组 ， 每 个 分 组 10 000 比特 长 、 从 源 主机 移动 第 一 个 分 组 到 第 一 
台 交 换 机 需要 多 长 时 间 ? 从 第 一 台 交 换 机 发 送 第 一 个 分 组 到 第 二 台 交 换 机 ， 从 源 主 机 发 送 第 二 个 
分 组 到 第 一 台 交 换 机 各 需要 多 长 时 间 ? 什么 时 候 第 二 个 分 组 能 被 第 一 台 交 换 机 全 部 收 到 ? 
c， 当 进行 报 文 分 段 时 ， 从 源 主 机 向 目的 主机 移动 该 文件 需要 多 长 时 间 ?” 将 该 结果 与 Ca) 的 答案 进 
行 比 较 并 解释 之 。 
d. 除了 减 小 时 延 外 ,使 用 报 文 分 段 还 有 什么 原因 ? 
e 讨论 报 文 分 段 的 缺点 ， 
P32. 用 本 书 的 Web 网 站 上 的 报 文 分 段 小 Java 小 程序 进行 实验 。 该 程序 中 的 时 延 与 前 一 个 习题 中 的 时 延 
相当 吗 ” 链 路 传播 时 延 是 怎样 影响 分 组 交换 (有 报 文 分 段 ) AAR SC BE PRY og EY Shag LE EY 
P33. 考虑 从 主机 A 到 主机 B 发 送 一 个 比特 的 大 文件 。A A B 之 间 有 两 段 链 路 (AIP TT SPRL). EH 
该 链 路 不 拥塞 ( 即 没 有 排队 时 延 )。 主 机 A 将 该 文件 分 为 每 个 为 $ 比特 的 报 文 段 ， 并 为 每 个 报 文 段 
增加 一 个 80 比特 的 首部 ， 形 成 上 =80 +5 比特 的 分 组 .每 条 链 路 的 传输 速率 为 尺 bps. 求 出 从 A 到 B 
移动 该 文件 时 延 最 小 的 值 S- 忽略 传播 时 延 ， 
P34. Skype 提供 了 一 种 服务 ， 使 你 能 用 PC 向 普通 电话 打 电 话 。 这 意味 着 语音 呼叫 必须 通过 因特网 和 电话 
网 .讨论 这 是 如 何 做 到 的 


Ci Wireshark 实验 


“不 闻 不 若 闻 之 ， 闻 之 不 车 见 之 ， 见 之 不 若 知 之 ， 知 之 不 车 行 之 ,” 





P itis 
一 个 人 通常 能 够 通过 以 下 方法 加 深 对 网 络 协议 的 理解 ， US EB SE AZ aE AEE, Ee 
个 协议 实体 之 间 交 换 的 报 文 序列 ， 钻 研 协议 运行 的 细节 ， 使 协议 执行 某 些 动作 ， 观 察 这 些 动作 及 其 后 果 : 
这 能 够 在 仿真 环境 下 或 在 如 因特网 这 样 的 真实 网 络 环境 下 完成 。 在 本 书 配套 Web 站 点 上 的 Java 7) FEE R 
用 的 是 第 一 种 方法 。 在 Wireshark 实验 中 ,我 们 将 采用 后 一 种 方法 : 你 可 以 在 家 中 或 实验 室 中 使 用 提 面 计 
算 机 在 各 种 情况 下 运行 网 络 应 用 程序 。 在 你 的 计算 机 上 观察 网 络 协议 ， 它 是 如 何 与 在 因特网 别处 执行 的 


协议 实体 交互 和 交换 报 文 的 。 因 此 ， 你 与 你 的 计算 机 将 是 这 些 真 实 实验 的 有 机 组 成 部 分 。 你 将 通过 动手 
来 观察 和 学 习 。 


用 来 观察 执行 协议 实体 之 间 交 换 的 报 文 的 基本 工具 称 为 分 组 嗅 探 器 (packet sniffer). 顾名思义 ， 一 
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ES 页 (IRIK) 申 你 的 计算 机 发 送 和 接收 的 报 文 ; 它 也 能 显示 出 这 些 被 俘获 报 文 的 各 

个 协议 字段 的 内 容 。 图 1-28 中 显示 了 Wireshark 4) 27 IRER aa AY GE AE TRUE, Wireshark 是 一 个 运行 在 Win- 
ries Linux/Unix 和 Mac iF BLE AY St Be} ZR tit. OT SE, MHE Wireshark 实验 能 让 你 探索 在 
该 章 中 学 习 的 一 些 协议 。 在 这 第 一 个 Wireshark 实验 中 ， 你 将 获得 并 安装 一 个 Wireshark 的 副本 ， 访 问 一 
个 Web 站 点 ,俘获 并 检查 在 你 的 Web i Di ak A Web 服务 带 之 间 交 换 的 协议 报 文 。 
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图 1-28 一 个 Wireshark 屏幕 快照 (打印 的 Wireshark 屏幕 快照 得 到 了 Wireshark 基金 会 的 许可 ) 


你 能 够 在 Web 站 点 http://www. awl. com/kurose-ross 上 找到 有 关 该 第 一 个 Wireshark 实验 的 全 部 材料 
(包括 如 何 获得 并 安装 Wireshark 的 指导 )。 


人 物 专访 


Leonard Kleinrock 是 加 州 大 学 洛杉矶 分 校 (UCLA) 的 计算 机 科学 教授 . 
1969 年 ， 他 在 UCLA 的 计算 机 成 为 因特网 的 第 一 个 结 点 。 1961 年 ， 他 创造 的 分 
组 交换 原理 成 为 因特网 的 支撑 技术 - 他 在 纽约 城市 大 学 〈City College of New 
York, CCNY) 获得 电子 工程 学 士 学 位 ， 并 在 麻 省 理工 学 院 (MIT) 获得 电子 工 
程 硕士 和 博士 学 位 。 








。 是 什么 使 得 您 决定 专门 研究 网 络 / 因 特 网 技术 的 ” 

当 我 于 1959 年 在 MIT 该 博士 时 ， 我 发 现 周 于 的 大 多 数 同 学 正在 信息 理论 和 编 
码 理论 领域 做 研究 。 在 MIT， 那 时 有 伟大 的 研究 者 Claude Shannon, ， 他 已 经 开创 这 些 领 域 ， 并 且 已 经 解决 
了 许多 重要 的 问题 。 留 下 来 的 研究 问题 既 难 又 不 太 重 要 。 因 此 我 决定 开始 新 的 研究 领域 ， 而 该 领域 其 他 
人 还 没有 想到 ， 回想 那 时 在 MIT 我 的 周围 有 许多 计算 机 ， 我 很 清楚 很 快 这 些 计算 机 将 有 相互 通信 的 侧 
求 。 在 那 时 ， 却 没有 有 效 的 办 法 来 做 到 这 一 点 ， 因 此 我 决定 研发 能 够 创建 有 效 的 数据 网 络 的 技术 . 

© 您 在 计算 机 产业 的 第 一 份 工作 是 什么 ?” 它 使 您 有 哪些 收益 ? 

1951 ~ 1957 E, 我 为 了 获得 电子 工程 学 士 学 位 在 CCNY 读 夜 大 。 在 那 段 时 间 里 ,我 在 一 家 称 为 
Photobell 的 工业 电子 小 公司 工作 ， 先 是 当 技 术 员 ， 然 后 当 工 程 师 。 在 那里 ， 我 在 它们 的 产品 线 上 引入 了 

字 技 术 。 我 们 主要 使 用 光电 子 设备 来 检测 某 些 物体 (盒子 、 人 等 ) 的 存在 ， 一 种 称 为 双 稳 态 多 频 振 水 
nip HERMT BE AA ASS YE EES BC SA ES | A eR Sa, TE ET YL TY BE 
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本 模块 ， 用 今天 的 话说 就 是 触发 电路 或 交换 器 。 

© 当 您 发 送 第 一 个 主机 到 主机 报 文 (从 UCLA 到 斯 坦 福 研究 院 ) 时 ， 您 心中 想到 了 什么 ? 

坦率 地 说 ， 我 们 当时 并 没有 想到 那 件 事 的 重要 性 。 我 们 没有 准备 具有 历史 意义 的 察 言 壮 语 ， 就 像 童 
日 许多 发 明 家 所 做 的 那样 EZR + BEART “ar elle FPA (What hath God wrought)”, PW 
K+ 格 瑞 汉 姆 : 贝尔 的 “Watson 先生 ， 请 来 这 里 ! 我 想见 你 ", EIR < 阿姆斯特朗 的 “个 人 的 一 小 步 ， 
人 类 的 一 大 步 ”) 。 多 么 聪明 的 人 哪 ! 他 们 明白 媒体 和 公众 的 关系 。 我 们 要 做 的 所 有 工作 是 问 斯 坦 福 人 研究 
院 的 计算 机 进行 注册 。 当 我 们 键入 “L”， 它 被 正确 收 到 ， 当 我 们 键入 “o” 又 被 正确 收 到 ， 而 当 我 们 键 
人 “g” 则 引起 斯 坦 福 研究 院 主机 的 崩溃 ! 因此 ， 这 将 我 们 的 报 文 转 换 为 最 短 的 ， 也 许 是 最 有 预测 性 的 
报 文 ,“Lo!” 即 为 “ 真 想不到 (Lo and behold)!”。 

那 年 早 些 时 候 ，UCLA 新 闻 稿 引用 我 的 话说 ， 一 旦 该 网 络 建 立 并 运行 起 来 ， 将 可 能 从 我 们 的 家 中 和 
办 公 室 访问 计算 机 设施 ， 就 像 我 们 获得 电力 和 电话 连接 那样 容易 。 因 此 那 时 我 的 美好 愿望 是 ， 因 特 网 将 
是 一 个 无 所 不 在 的 、 总 是 运行 的 、 总 是 可 用 的 网 络 ， 任 何人 从 任何 地 方 用 任何 设备 将 能 够 与 之 相连 ， 并 
且 它 将 是 不 可 见 的 。 然 而 ， 我 从 没有 期 待 我 的 99 岁 的 母亲 将 能 够 上 因特网 ， 但 她 的 确 做 到 了 这 一 点 。 

© 您 对 未 来 网 络 的 展望 是 什么 ? 

我 的 展望 中 最 容易 的 部 分 是 预测 基础 设施 本 身 。 我 预见 我 们 看 到 移动 计算 、 移 动 设备 和 智能 空间 的 
大 量 部 署 。 轻 量 级 、 廉 价 、 高 性 能 、 便 携 的 计算 和 通信 设备 (加 上 因特网 的 无 处 不 在 ) 的 确 使 我 们 成 为 
游牧 一 员 。 游 牧 计 算是 指使 从 一 个 地 方 旅行 到 男 一 个 地 方 的 端 用 户 ， 以 透明 方式 访问 因特网 服务 ， 无 论 
他 们 旅行 到 何 处 ,无论 他 们 携带 什么 设备 或 获得 何 种 接 入 。 展 望 中 最 困难 的 部 分 是 预测 应 用 和 服务 ， 它 
们 以 引 人 注 目的 方式 不 断 地 带 给 我 们 惊喜 (电子 邮件 、 搜 索 技术 、 万 维 网 、 博 客 、 社 交 网 络 、 用 户 一 代 
以 及 音乐 、 照 片 和 视频 等 的 共享 ) 。 我 们 正面 临 一 种 新 的 惊奇 和 创新 ， 即 移动 应 用 装载 于 手持 设备 中 。 

下 一 步 将 使 我 们 从 信息 空间 虚拟 世界 ( netherworld) 移动 到 智能 空间 的 物理 世界 。 我 们 的 环境 (办 
公 桌 、 墙 壁 、 车 辆 、 钟 表 、 上 腰带 等 ) 将 因 技 术 而 棚 棚 如 生 ， 这 些 技术 包括 激励 右 〈actuator) 、 传 感 姑 、 
逻辑 、 处 理 、 存 储 、 照 相机 、 麦 克 风 、 话 简 、 显 示 器 和 通信 。 这 种 能 人 式 技术 将 使 得 环境 能 提供 我 们 南 
要 的 IP 服务 。 当 我 走 进 一 间 房间 时 ， 该 房间 知道 我 的 到 来 。 我 将 能 够 与 环境 自然 地 通信 ， 如 同 说 英语 一 
样 ; 我 的 请 求 产 生 的 响应 将 从 墙 上 的 显示 器 通过 我 的 眼镜 以 Web 网 页 的 形式 呈现 给 我 ， 就 像 说 话 、 全 县 
照相 等 一 样 。 

再 向 前 看 一 点 ， 我 看 到 未 来 的 网 络 包括 了 下 列 附加 的 关键 组 件 。 我 看 到 在 网 络 各 处 部 署 的 智能 软件 
代理 ， 它 的 功能 是 挖掘 数据 ， 根 据 数据 采取 动作 ， 观 察 趋 势 ， 并 能 动态 地 、 自 适应 地 执行 任务 。 我 看 到 
相当 多 的 网 络 流量 并 不 是 由 人 产生 的 ， 而 是 由 这 些 艇 入 式 设备 和 这 些 智 能 软件 代理 产生 的 。 我 看 到 大 批 
的 自 组 织 系统 控制 这 个 巨大 、 快 速 的 网 络 。 我 看 到 巨 量 的 信息 瞬间 通过 网 络 立即 得 到 强力 处 理 和 过 滤 。 
因特网 最 终 将 是 一 个 无 所 不 在 的 全 球 性 神经 系统 。 当 我 们 急速 在 21 世纪 进发 时 ， 我 将 看 到 这 些 东西 和 更 
多 的 东西 。 

o 哪些 人 激发 了 您 的 专业 灵感 ? 

到 目前 为 止 , 是 麻 省 理工 学 院 的 Claude Shannon。 他 是 一 名 时 越 的 研究 者 ， 具 有 以 高 度 直 觉 的 方式 将 
他 的 数学 理念 与 物理 世界 关联 起 来 的 能 力 。 他 是 我 的 博士 论文 答辩 委员 会 的 成 员 。 

e 您 对 进入 网 络 / 因 特 网 领域 的 学 生 们 有 什么 忠告 吗 ? 

因特网 和 由 它 使 能 的 所 有 东西 是 一 个 巨大 的 新 前 沿 ， 充 满 了 令 人 惊奇 的 挑战 ， 为 众多 创新 提供 了 广 
阔 空 间 。 不 要 受 今 天 技术 的 束缚 ， 开 动 大 脑 ， 想 象 能 够 做 些 什么 ， 并 去 实现 它 。 
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网 络 应 用 是 计算 机 网 络 存在 的 理由 ， 如 果 我 们 不 能 构想 出 任何 有 用 的 应 用 ， 也 就 没有 
任何 必要 去 设计 文 持 它 们 的 网 络 协 议 卫 。 目 因特网 发 明 以 来 ， 的 确 已 开发 出 众多 有 用 的 、 
有 趣 的 网 络 应 用 。 这些 应 用 程序 已 经 成 为 因特网 成 功 的 驱动 力 ， 激 励 人 们 在 家 庭 、 学 校 、 
政府 和 商业 中 利用 网 络 ， 使 因特网 成 为 他 们 日 常 活动 的 密 不 可 分 的 一 部 分 . 

因特网 应 用 包括 20 世纪 70 年 代 和 80 年 代 开 始 流 行 的 、 经 典 的 基于 文本 的 应 用 ， 如 
文本 电子 邮件 、 和 远程 访问 计算 机 、 文 件 传输 和 新 闻 组 ;还 包括 20 世纪 90 年 代 中 期 的 招 人 
喜爱 的 应 用 一 一 万 维 网 ， 包 括 Web 冲浪 、 搜 索 和 电子 商务 ; 还 包括 20 世纪 末 引 入 的 两 个 
招 人 喜爱 的 应 用 一 一 即 即 时 讯 旺 和 对 等 〈P2P) 文件 共享。 目 2000 年 以 来 ， 我 们 见证 了 流 
行 的 语音 和 视频 应 几 的 爆炸 ， 包 括 IP Hii (VolP), IP 视频 会 议 (如 Skype); 用 户 生 成 
的 视频 分 布 ( 如 YouTube); 以 及 点 播 电 影 (如 Netflix). 与 此 同时 ， 我们 也 看 到 了 极 有 吸 
| 力 的 多 方 在 线 游戏 的 出 现 ， 包 括 《 第 二 人 生 》(Second Life) Fl (ESIH) (World of 
Warcraft). 最近， 我们 已 经 看 到 了 新 一 代 社 交 网 络 应 用 如 Facebook 和 Twitter， 它 们 在 因 特 
网 的 路 由 融和 通信 和 链 路 网 络 上 创建 了 引人入胜 的 人 的 网 络 。 显 然 ， 新 型 和 令 人 兴奋 的 因 特 
网 应 用 并 没有 减缓 .。 也许 本 书 的 一 些 读者 将 创建 下 一 代 招 人 癌 爱 的 因特网 应 用 。 

在 本 章 中 ， 我 们 学 习 有 关 网 络 应 用 的 原理 和 实现 方面 的 知识 。 我 们 从 定义 几 个 关键 的 
应 用 层 概 念 开始 ， 其 中 包括 应 用 程序 所 需要 的 网 络 服务 、 客 户 和 服务 闫 、 进 程 和 运输 层 按 
O. 我 们 详细 考察 几 种 网 络 应 用 程序 ， 包 括 Web. 、 电 子 邮件 、DNS 和 对 等 文件 分 发 (第 8 
草 关 注 多 媒体 应 用 ， 包 括 流 式 视频 和 IP 电话 ) 。 然 后 我 们 将 涉及 开发 运行 在 TCP 和 UDP 
上 的 网 络 应 用 程序 。 特 别 是 ， 我 们 学 习 套 接 字 API， 并 浮光掠影 地 学 习 用 Python 语言 写 的 
一 些 简单 的 客户 -服务 器 应 用 程序 。 在 本 章 后 面 ， 我 们 也 将 提供 几 个 有 趣 、 有 意思 的 套 接 


字 编 程 作 业 。 
应 用 层 是 我 们 学 习 协 议 非 常 好 的 起 点 ， 它 最 为 我 们 所 熟悉 。 我 们 熟悉 的 很 多 应 用 就 是 


建立 在 这 些 将 要 学 习 的 协议 基础 上 的 。 通 过 对 应 用 层 的 学 习 ， 将 有 助 于 我 们 认 知 协议 有 关 
知识 ， 将 使 我 们 了 解 到 很 多 问题 ， 这 些 问 题 当 我 们 笠 习 运输 层 、 网 络 层 及 数据 链 路 层 协 议 
时 也 同样 会 碰 到 . 


2.1 应 用 层 协 议 原理 


假定 你 对 新 型 网 络 应 用 有 了 一 些 想法 - 也 许 这 种 应 用 将 为 人 类 提供 一 种 伟大 的 服务 ， 
或 者 将 使 你 的 教授 高 兴 ， 或 者 将 审 给 你 大 量 的 财 定 ,或 者 只 是 在 开发 中 获得 乐趣 。 无 论 你 
的 动机 是 什么 ， 我 们 现在 考察 一 下 如 何 将 你 的 想法 转变 为 一 种 真实 世界 的 网 络 应 用 。 

人 研发 网 络 应 用 程序 的 核心 是 写 出 能 够 运行 在 不 同 的 端 系 统 和 通过 网 络 彼此 通信 的 程 
序 。 例 如 ， 在 Web 应 用 程序 中 ， 有 两 个 互相 通信 的 不 同 的 程序 : 一 个 是 运行 在 用 户主 机 
( 困 面 机 、 膝 上 上 机、 平板 电脑 、 智 能 电话 等 ) 上 的 浏览 需 程 序 ; 另 一 个 是 运行 在 Web 服务 
做 主机 上 的 Web 服务 需 程 序 。 另 一 个 例子 是 P2P 文件 共享 系统 ， 在 参与 文件 共享 的 社区 
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中 的 每 台 主 机 中 都 有 一 个 程序 。 在 这 种 情况 下 ， 在 各 台 主 机 中 的 这 些 程序 可 能 都 是 类 似 的 
或 相同 的 
KE, “SAC Br AY inne ‘hE ELE Se i in FRE EZITE. Min, AEK 
Pree HC. Java 或 Python 来 编写 .重要 的 是 ， 你 不 震 要 与 在 网 络 核心 设备 如 路 由 需 或 链 
路 层 交 换 机 上 运行 的 软件 ,即使 你 要 为 网 络 核心 设备 写 应 用 程序 软件 ， 你 也 不 能 做 到 这 一 
ei. 如 我 们 在 第 1 曹 所 知 ， 以 及 如 图 1-24 所 显示 的 那样 ， 网 络 核心 设备 并 不 在 应 用 层 上 
起 作用 ， 而 仅 在 较 低 层 起 作用 ， 特 别 是 位 于 网 络 层 及 下 面 层 次 。 这 种 基本 设计 ， 也 即将 应 
用 软件 限制 在 端 系统 【( 如 图 2-1 所 示 ) 的 方法 ， 促 进 了 大 量 的 网 络 应 用 程序 的 迅速 研发 和 





图 2-1 在 应 用 层 的 端 系 统 之 间 的 网 络 应 用 的 通信 


2.1.1 网 络 应 用 程序 体系 结构 


当 进 行 软 件 编码 之 前 ， 应 当 对 应 用 程序 pM signi RAITT RY. IEMET H) 
体系 结构 明显 不 同 于 网 络 的 体系 结构 (例如 在 第 1 章 中 所 讨论 的 5 层 因 特 网 体系 结构 ) . 











WIHT BE De AC AREA, WRR Pe EY, JRA RR RE IR HE 
合 、 在 另 一 方面 ， 应 用 程序 体系 结构 (application architecture) Fw SH Be OF A A ih, 
规定 了 如 何在 各 种 端 系统 上 组 织 该 应 用 程序 。 在 选择 应 用 程序 体系 结构 时 ， 应 用 程序 人 研发 
者 很 可 能 利用 现代 网 络 应 用 程序 中 所 使 用 的 两 种 主流 体系 结构 之 一 : 客户 -服务 右 体 系 结 
构 或 对 等 (P2P) 体系 结构 。 

在 客户 -服务 器 体系 结构 (client-server architecture) 中 ， 有 一 个 总 是 打开 的 主机 称 为 
服务 器 ， 它 服务 于 来 自 许 多 其 他 称 为 客户 的 主机 的 请 求 。 一 个 经 典 的 例子 是 Web 应 用 程 
序 ， 其 中 总 是 打开 的 Web 服务 高 服务 于 来 日 浏览 副 (运行 在 客户 主机 上 ) Kiik. 
Web 服务 器 接收 到 来 自 某 客户 对 某 对 象 的 请 求 时 ， 它 向 该 客户 发 送 所 请 求 的 对 象 作 为 响 
应 。 值 得 注意 的 是 利用 客户 - 服务 带 体 系 结 恤 ， 客户 相互 之 间 不 埋 接 通信 ; 例如 ， 在 Web 
应 用 中 两 个 浏览 副 并 不 直接 通信 。 客 户 -服务 此 体 系 结构 的 男 一 个 特征 是 该 服务 右 具 有 辕 
定 的 、 周 知 的 地 址 ， 该 地 址 称 为 IP 地 址 (我们 将 很 快 讨论 它 )。 因为 该 服务 各 具有 固定 
的 、 周 知 的 地 址 ， 并 且 因 为 该 服务 费 总 是 打开 的 ， 客 户 总 是 能 够 通过 向 该 服务 右 的 1P 地 
址 发 送 分 组 来 与 其 联系 。 有 具有 客户 -服务 硕 体 系 结构 的 非常 著名 的 应 用 程序 包括 Web, 
FTP, Telnet 和 电子 邮件 。 图 2-2a 中 显示 了 这 种 客户 - 服务 器 体系 结构 





a) 客户 -服务 器 体系 结构 b) P2P 体 系 结构 


到 2-2 客户 -服务 器 体系 结构 及 P2P 体系 结构 


在 一 个 客户 -服务 器 应 用 中 ， 常 常会 出 现 一 台 单 独 的 服务 器 主机 跟 不 上 它 所 有 客户 请 


变 得 不 堪 重 负 。 为 此 ， 配备 大 量 主机 的 数据 中 心 常 被 用 于 创建 哩 大 的 虚拟 服务 毅 。 最 为 流 
行 的 因特网 服务 如 搜索 引擎 ( 如 谷歌 和 Bing) 、 因 特 网 商务 (如 亚马逊 和 e-Bay) 、 基 
F Web 的 电子 邮件 (如 Gmail 和 雅虎 邮件 ) 、 社 交 网 络 (如 脸谱 和 推 竺 ) ， 就 应 用 了 一 个 
或 多 个 数据 中 心 。 如 在 1.3.3 市 中 所 讨论 的 者 样 ， 合 歌 有 分 布 于 全 世界 的 30 ~ 50 个 数据 
中 心 ， 这 些 数据 中 心 共 同 处 理 搜索 、YouTube 、Gmail 和 其 他 服务 。 一 个 数据 中 心 能 够 有 数 
十 万 台 服 务 胡 ， 它 们 必须 要 供电 和 和 维护。 此 外 ， 服 务 提供 商 必 须 支 付 不 断 出 现 的 互联 和 种 
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WRH, AEX APE ENAK A BE PUL aH 
在 一 个 P2P 体系 结构 (P2P architecture) P, MFR AUDA SHIR at Al te a 
的 〈 或 者 没有 ) 依赖 。 相反 ， 应 用 程序 在 间断 连接 的 主机 对 之 间 使 用 直接 通信 ， 这 
主机 对 被 称 为 对 等 方 。 这 些 对 等 方 并 不 为 服务 提供 商 所 有 ， 相 反 却 为 用 re ha 
ABR ELA A, Ke BOT ETT GE PAE ES 、 大 学 和 办 公 室 。 因 为 这 种 对 等 方 通信 不 必 通 
过 专门 的 服务 郝 ， 该 体系 结构 被 称 为 对 等 方 到 对 等 方 的 。 许 多 目前 流行 的 、 流 量 密集 型 
应 用 都 是 P2P 体系 结构 的 。 这 些 应 用 包括 文件 共享 (例如 BitTorrent) 、 对 等 方 协助 下 载 加 
at ( PGR) 、 因 特 网 电话 (例如 Skype) IPTV (例如 “迅雷 看 看 ”和 PPstream ) . 
图 2-2b 中 显示 了 PP 的 体系 结构 需要 提 及 的 是 ， 茶 些 应 用 具有 混合 的 体系 结构 ， 它 
结合 了 客户 -服务 袁 和 P2P 的 元 素 。 例如， 对 于 许多 即时 讯息 应 立 用 而 言 ， 服 务 胡 被 用 于 
跟 中 用户 的 IP 地 址 ， 但 用 户 到 用 户 的 报 文 在 用 户主 机 之 间 (无 需 通 过 中 间 服 务 磊 ) A 
接 发 送 ， 
P2P 体系 结构 的 最 引人入胜 的 特性 之 一 是 它们 的 自 扩展 性 ( self- scalability ) 。 例 如 ， 
在 一 个 PP 文件 共享 应 用 中 ， 尽 管 每 个 对 等 方 都 由 于 请 求 文件 产生 工作 量 ， 但 每 个 对 等 方 
通过 向 其 他 对 等 方 分 发 文件 也 为 系统 增加 服务 能 力 。P2P 体系 结构 也 是 成 本 有 效 的 ， 因 为 
它们 通常 不 需要 庞大 的 服务 紫 基 础 设施 和 服务 融 市 客 (这 与 具有 数据 中 心 的 客户 - 服务 需 
设计 形成 反差 ) 。 然 而 ， 未 来 P2P 应 用 面临 三 个 主要 挑战 : 
。 ISP 友好 。 大 多 数 住宅 ISP (包括 DSL 和 电费 ISP) 已 经 受制 于 “ 非 对 称 的 ”带宽 
应 用 ， 也 就 是 说 ， 下 载 比 上 载 要 多 得 多 。 但 是 P2P 视频 流 和 文件 分 发 应 用 改变 了 
从 服务 硕 到 住宅 ISP 的 上 载 流 量 ， 因 而 给 ISP 市 来 了 巨大 压力 。 未 来 P2P 应 用 需要 
设计 对 ISP 友好 的 模式 [ Xie 2008 | 。 
© 安全 性 。 因 为 它们 的 高 度 分 布 和 开放 特性 ，P2P 应 用 给 安全 带 来 挑战 [Doucer 
2002; Yu 2006; Liang 2006; Naoumov 2006; Dhungel 2008; LeBlond 2011 | . 
e 激励 . 未 来 PP 应 用 的 成 功 也 取决 于 说 服用 户 目 愿 回 应 用 提供 带宽 、 存 储 和 计算 
资源 ， 这 对 激励 设计 市 来 挑战 | Feldman 2005; Piatek 2008; Aperjis 2008; Liu 
2010], 


2.1.2 进程 通信 


在 构建 网 络 应 用 程序 前 ， 还 需要 对 运行 在 多 个 端 系统 上 的 程序 是 如 何 互 相通 信 的 情况 
有 一 个 基本 了 解 。 在 操作 系统 的 术语 中 ， 进 行 通信 的 实际 上 是 进程 (process) 而 不 是 程 
序 。 一 个 进程 可 以 被 认为 是 运行 在 端 系 统 中 的 一 个 程序 。 当 进程 运行 在 相同 的 端 系统 上 
时 ， 它 们 使 用 进程 间 通 信 机 制 相 互通 信 。 进 程 间 通信 的 规则 由 端 系统 上 的 操作 系统 确定 。 
而 在 本 书 中 ， 我 们 不 怎么 关注 同一 台 主 机 上 的 进程 间 的 通信 ， 而 关注 运行 在 不 同 端 系统 
(可 能 具有 不 同 的 操作 系统 ) 上 的 进程 间 的 通信 。 

在 两 个 不 同 冰 系 统 上 的 进程 ， 通 过 览 越 计 算 机 网 络 交 换 报 文 (message) 而 相互 通信 。 
发 送 进程 生成 并 回 网 络 中 发 送 报 文 ; 接收 进程 接收 这 些 报 文 并 可 能 通过 将 报 文 发 送 回 去 进 
行 啊 应 。 图 2-1 图 示 了 进程 是 如 何 通 过 使 用 5 层 协议 栈 的 应 用 层 互 相通 信 的 .， 

1. 客户 和 服务 如 进程 

网 络 应 用 程序 申 成 对 的 进程 组 成 ， 这 些 进 程 通过 网 络 相 互 发 送 报 文 。 例 如 ， 在 Web 
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应 用 程序 中 ， 一 个 客户 浏览 希 进 程 与 一 台 Web 服务 着 进程 交换 报 文 。 在 一 个 PP 文件 共 
齐 系 统 中 ， 文 件 从 一 个 对 等 方 中 的 进程 传输 到 另 一 个 对 等 方 中 的 进程 。 对 每 对 通信 进程 ， 
我 们 通常 将 这 两 个 进程 之 一 标识 为 客户 (client) ， 而 另 一 个 进程 标识 为 服务 器 (server). 
对 于 Web 而 言 ， 浏 览 器 是 一 个 客户 进程 ，Web 服务 器 是 一 台 服 务 器 进程 。 对 于 P2P 文件 
太 享 ， 下 载 文件 的 对 等 方 标识 为 客户 ， 上 载 文件 的 对 等 方 标识 为 服务 兰 。 

你 或 许 已 经 观察 到 ， 如 在 P2P 文件 共享 的 某 些 应 用 中 ， 一 个 进程 能 够 既是 客户 又 是 服 
Bar, E PZP 文件 共 吾 系统 中 ， 一 个 进程 的 确 婚 能 上 载 文 件 又 能 下 载 文 件 。 无 论 如 何 ， 在 
任何 给 定 的 一 对 进程 之 间 的 通信 会 话 场 景 中 ， 我们 仍 能 将 一 个 进程 标识 为 客户 ， 男 一 个 进 
算 标 识 为 服务 硕 。 我们 定义 客户 和 服务 需 进 程 如 下 : 

在 给 定 的 一 对 进程 之 间 的 通信 会 话 场景 中 ， 发 起 通信 ( 即 在 该 会 话 开始 时 发 

起 与 其 他 进程 的 联系 ) 的 进程 被 标识 为 客户 ， 在 会 话 开始 时 等 待 联系 的 进程 是 服 

Be 

在 Web 中， 一 个 浏览 如 进程 同一 台 Web IRI ait Fe IK AA, TAL a Ok aE Pe aE 
客户 ， 而 该 Web Ik HER ENR S ah. E PP 文件 共享 中 ， 当 对 等 方 A 请 求 对 等 方 B 发 
送 一 个 特定 的 文件 时 ， 在 这 个 特定 的 通信 会 话 中 对 等 方 A 是 客户 ， 而 对 等 方 B 是 服务 器 。 
在 不 致 混 清 的 情况 下 ， 我 们 有 时 也 使 用 术语 “应 用 程序 的 客户 端 和 服务 需 端 ” 。 在 本 章 的 
结 尾 ， 我 们 将 和 逐步 讲解 网 络 应 用 程序 的 客户 端 和 服务 需 端 的 简单 代码 。 

2. 进程 与 计算 机 网 络 之 间 的 接口 

如 上 所 述 ， 多 数 应 用 程序 是 由 通信 进程 对 组 成 ， 每 对 中 的 两 个 进程 互相 发 送 报 文 。 从 
一 个 进程 同 男 一 个 进程 发 送 的 报 文 必须 通过 下 面 的 网 络 。 进 程 通 过 一 个 称 为 套 接 字 (socket) 
的 软件 接口 回 网络 发 送 报 文 和 从 网 络 接收 报 文 。 我 们 考虑 一 个 类 比 来 帮助 我 们 理解 进程 和 
矢 接 字 。 进 程 可 类 上 比 于 一 座 房 子 ， 而 它 的 套 接 字 可 以 类 比 于 它 的 门 。 当 一 个 进程 想 向 位 于 
另外 一 台 主 机 上 的 另 一 个 进程 发 送 报 文 时 ， 它 把 报 文 推出 该 门 〈 套 接 字 )。 该 发 送 进程 假 
定 该 门 到 男 外 一 侧 之 则 有 运输 的 基础 设施 ， 该 设施 将 把 报 文 传送 到 目的 进程 的 门口 。 一 旦 
该 报 文 抵达 目的 主机 ， 它 通过 接收 进程 的 门 〈( 套 接 字 ) 传递 ， 然 后 接收 进程 对 该 报 文 进行 
处 理 。 

图 2-3 显示 了 两 个 经 过 因特网 通信 的 进程 之 间 的 套 接 字 通信 (图 2-3 中 假定 由 该 进程 
使 用 的 下 面 运 输 层 协议 是 因特网 的 TCP 协议 ) 。 如 该 图 所 示 ， 套 接 字 是 同一 台 主 机 内 应 用 
层 与 运输 层 之 间 的 接口 。 由 于 该 套 接 字 是 建立 网 络 应 用 程序 的 可 编程 接口 ， 因 此 套 接 字 也 
称 为 应 用 程序 和 网 络 之 间 的 应 用 程序 编程 接口 (Application Programming Interface, API), 
应 用 程序 开发 者 可 以 控制 套 接 字 在 应 用 层 端的 一 切 ， 但 是 对 该 套 接 字 的 运输 层 端 几 乎 没有 
控制 权 。 应 用 程序 开发 者 对 于 运输 层 的 控制 仅 限 于 : 选择 运输 层 协议 ; @ 也 许 能 设 定 几 
个 运输 层 参 数 ， 如 最 大 缓存 和 最 大 报 文 段 长 度 等 〈 将 在 第 3 EPR), 一 旦 应 用 程序 开 
发 少 选 择 了 一 个 运输 层 协 以 〈《 如 宁可 供 选 择 的 话 ) ， 则 应 用 程序 就 建立 在 由 该 协议 提供 的 
运输 层 服务 之 上 。 我 们 将 在 2.7 节 中 对 套 接 字 进行 更 为 详细 的 探讨 。 

3. 进程 寻 址 

为 了 回 特定 目的 地 发 送 邮政 邮件 ， 目 的 地 需要 有 一 个 地 址 。 类 伏地 ， 在 一 台 主 机 上 运行 
的 进程 为 了 回 在 另 一 台 主 机 上 运行 的 进程 发 送 分 组 ， 接 收 进 程 需要 有 一 个 地 址 。 为 了 标识 该 
接收 进程 ， 需 要 定义 两 种 信息 : (主机 的 地 址 ; 定义 在 目的 主机 中 的 接收 进程 的 标识 符 。 


Rh 
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EMAAR SS RS 主机 或 服务 局 





由 应 用 程序 开发 者 控制 


由 应 用 程序 开发 者 控制 — 





| 
由 操作 系统 控制 一 一 + a | | 由 操作 系统 控制 
| 变量 的 TCP | 人 | 变量 的 TCP | 


| | 因特网 | 


图 2-3 应 用 进程 、 套 接 字 和 下 面 的 运输 层 协 以 


在 因特网 中 ， 主 机 由 其 IP 地 址 (IP address) 标识 。 我们 将 在 第 4 草 中 非常 详细 地 讨 
论 IP 地 址 。 些 时 ,我 们 只 要 知道 IP 地 址 是 一 个 32 比特 的 量 且 它 能 够 叭 一 地 标识 该 主机 就 
人 够 了 了。 除了 知道 报 文 送 往 目 的 地 的 主机 地 址 外 ， 发 送 进程 还 必须 指定 运行 在 接收 主机 上 的 
接收 进程 〈 更 具体 地 说 ， 接 收 套 接 字 ) 。 因 为 一 般 而 言 一 台 主 机 能 够 运行 许多 网 络 应 用 ， 
这 些 信息 是 需要 的 。 目 的 地 端口 号 (port number) 用 于 这 个 目的 。 已 经 给 流行 的 应 用 分 配 
了 特定 的 端口 号 。 例 如 ，Web 服务 费用 端口 号 80 来 标识 。 邮 件 服务 需 进 程 〈 使 用 SMTP 
协议 ) 用 端口 号 25 来 标识 。 用 于 所 有 因特网 标准 协议 的 周知 端口 号 的 列表 能 够 在 http ; // 
www. iana. org 处 找到 -我们 将 在 第 3 草 中 详细 和 学习 端口 号 。 


2.1.3 可 供应 用 程序 使 用 的 运输 服务 


前 面 讲 过 套 接 字 是 应 用 程序 进程 和 运输 层 协议 之 间 的 接口 。 在 发 送 端的 应 用 程序 将 报 
文 推 进 该 套 接 字 。 在 该 套 接 字 的 另 一 侧 ， 运 输 层 协议 负责 使 该 报 文 进入 接收 进程 的 套 
EF. 

包括 因特网 在 内 的 很 多 网 络 提供 了 不 止 一 种 运输 层 协议 。 当 开发 一 个 应 用 时 ， 必 须 先 
择 一 种 可 用 的 运输 层 协议 。 如 何 做 出 这 种 选择 呢 ? 最 可 能 的 方式 是 ， 通 过 研究 这 些 可 用 的 
运输 层 协议 所 提供 的 服务 ， 选 择 一 个 最 能 为 你 的 应 用 需求 提供 恰当 服务 的 协议 。 这 种 情况 
类 似 于 在 两 个 城市 间 旅 行 时 选择 飞机 还 是 火车 作为 交通 工具 。 你 必须 选择 一 种 或 另 一 种 ， 
而 且 每 种 运输 模式 为 你 提供 不 同 的 服务 〈 例 如 ， 火 车 可 以 直到 市 区 上 客 和 下 客 ， 而 飞机 提 
供 了 更 短 的 旅行 时 间 ) < 

一 个 运输 层 协议 能 够 为 调用 它 的 应 用 程序 提供 什么 样 的 服务 呢 ? 我 们 大 体能 够 从 四 个 
方面 对 应 用 程序 服务 要 求 进行 分 类 : 可 靠 数 据 传输 、 吞 叶 量 、 定 时 和 安全 性 。 

1， 可 靠 数据 传输 

如 第 1 章 讨论 的 那样 ， 分 组 在 计算 机 网 络 中 可 能 委 失 。 例 如， 分 组 能 够 使 路 由 器 中 的 
缓存 溢出 ， 或 者 当 分 组 中 的 某 些 比特 损坏 后 可 能 被 丢弃 。 像 电子 邮件 、 文 件 传输 、 远 程 主 
机 访问 、Web 文档 传输 以 及 金融 应 用 等 这 样 的 应 用 ， 数 据 丢失 可 能 会 造成 灾难 性 的 后 果 
(在 后 一 种 情况 下 ， 无 论 对 银行 或 对 顾客 都 是 如 此 !) 。 因 此 ， 为 了 支持 这 些 应 用 ， 必 须 做 
一 些 工作 以 确保 由 应 用 程序 的 一 端 发 送 的 数据 正确 、 完 全 地 交付 给 该 应 用 程序 的 另 一 端 . 
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如 果 一 个 协议 提供 了 这 样 的 确保 数据 交付 服务 ， 就 认为 提供 了 可 靠 数 据 传输 (reliable data 
transfer) 。 运 输 层 协议 能 够 潜在 地 回应 用 程序 提供 的 一 个 重要 服务 是 进程 到 进程 的 可 徘 效 
据 传 输 。 当 一 个 运输 协议 提供 这 种 服务 时 ， 发 送 进程 只 要 将 其 数据 传递 进 套 接 字 ， 就 可 以 
完全 相信 该 数据 将 能 无 差错 地 到 达 接 收 进 程 。 

当 一 个 运输 层 协议 不 提供 可 笔 数 据 传输 时 ， 由 发 送 进程 发 送 的 茶 些 数 据 可 能 不 能 够 到 
达 接 收 进程 。 这 可 能 能 被 容忍 丢失 的 应 用 (loss- tolerant application) 所 接受 ， 最 值得 注意 
的 是 多 媒体 应 用 ， 如 交谈 式 音频 /视频 ， 它 们 能 够 承受 一 定量 的 数据 丢失 。 在 这 些 多 媒体 
应 用 中 ， 于 失 的 数据 引起 播放 的 音频 /视频 出 现 小 十 扰 ， 而 不 是 致命 的 损伤 。 

2. ib 

在 第 1 EP FRIS| A FAT AUPE AY BE. 在 沿 着 一 条 网 络 路 径 上 的 两 个 进程 之 间 的 
通信 会 话 场景 中 ， 可 用 吞吐 量 就 是 发 送 进程 能 够 向 接收 进程 交付 比特 的 速率 。 因 为 其 他 会 
话 将 共享 沿 着 该 网 络 路 径 的 带宽 ， 并且 因为 这 些 会 话 将 会 到 达 和 离开 ， 该 可 用 耕 吐 量 将 随 
时 间 波 动 。 这 些 观 察 导 致 男 一 种 自然 的 服务 ， 即 运输 层 协 议 能 够 以 某 种 特定 的 速率 提供 确 
保 的 可 用 吞吐 量 。 使 用 这 种 服务 ， 该 应 用 程序 能 够 请 求 r 比特 / 秒 的 确保 存 叶 量 ， 并 且 该 
运输 协议 能 够 确保 可 用 吞吐 量 总 是 为 至 少 上 比特 / 秒 。 这 样 的 确保 和 厨 吐 量 的 服务 将 对 许多 
应 用 程序 有 吸引 力 。 例 如 ， 如 果 因 特 网 电话 应 用 程序 对 语音 以 32kbps 的 速率 进行 编码 ， 
那么 它 也 必须 以 这 个 速率 癌 网 络 发 送 数 据 ， 并 向 接收 应 用 程序 交付 数据 。 如 果 运 输 协 议 不 
能 提供 这 种 吞吐 量 ， 该 应 用 程序 或 以 较 低 速率 进行 编码 (并 且 接 收 足够 的 郁 叶 量 以 维持 这 
种 较 低 的 编码 速率 ) ， 或 它 可 能 必须 放弃 发 送 ， 这 是 因为 对 于 这 种 因特网 电话 应 用 而 言 ， 
接收 所 需 否 吐 量 的 一 半 是 几乎 没有 或 根本 没有 用 处 的 。 具 有 否 吐 量 要 求 的 应 用 程序 被 称 为 
带宽 敏感 的 应 用 (bandwidth- sensitive application )。 许 多 当前 的 多 媒体 应 用 是 市 宽 敏 感 的 ， 
尽管 某 些 多 媒体 应 用 程序 可 能 采用 自 适应 编码 技术 对 数字 语音 或 视频 以 与 当前 可 用 市 宪 相 
匹配 的 速率 进行 编码 。 

带宽 敏感 的 应 用 具有 特定 的 吞吐 量 要 求 ， 而 弹性 应 用 (elastic application) 能 够 根据 
情况 或 多 或 少 地 利用 可 供 使 用 的 甜 吐 量 。 电 子 邮件 、 文 件 传输 以 及 Web 传送 都 属于 弹性 


应 用 。 当 然 ， 否 吐 量 是 越 多 越 好 。 有 一 句 格 言说 得 好 ， 钱 越 多 越 好 ， 人 越 瘦 越美 ， 我 们 水 
ae AN Se GR Fr th et KB H! 
3. 定时 


运输 层 协 议 也 能 提供 定时 保证 。 如 同 具 有 吞吐 量 保证 那样 ， 定 时 保证 能 够 以 多 种 形 
式 实 现 。 一 个 保证 的 例子 如 : 发 送 方 注入 进 套 接 字 中 的 每 个 比特 到 达 接 收 方 的 套 接 字 不 
RF 100ms。 这 种 服务 将 对 交互 式 实 时 应 用 程序 有 吸引 力 ， 如 因特网 电话 、 虚 拟 环境 、 
电话 会 议和 多 方 游戏 ， 所 有 这 些 服务 为 了 有 效 性 而 要 求 数据 交付 有 严格 的 时 间 限 制 〈 参 
见 第 7 章 ，[ Gauthier 1999; Ramjee 1994] ) 。 例 如 ， 在 因特网 电话 中 ， 较 长 的 时 延 会 导 
会 话 中 出 现 不 自然 的 停顿 ; 在 多 方 游戏 和 虚拟 互动 环境 中 ， 在 做 出 动作 并 看 到 来 自 环 
境 〈 如 来 自 位 于 端 到 端 连接 中 另 一 端点 的 玩家 ) 的 响应 之 间 ， 较 长 的 时 延 使 得 它 失 去 
真实 感 。 对 于 非 实 时 的 应 用 ， 较 低 的 时 延 总 比较 高 的 时 延 好 ， 但 对 端 到 端的 时 延 没 有 严 
格 的 约束 。 

4. 安全 性 

最 后 ， 运 输 协议 能 够 为 应 用 程序 提供 一 种 或 多 种 安全 性 服务 ， 例 如， 在 发 送 主机 
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中 ,运输 协议 能 够 加 密 由 发 送 进程 传输 的 所 有 数据 ， 在 接收 主机 中 ， 运 输 层 协议 能 够 在 
将 数据 交付 给 接收 进程 之 前 解密 这 些 数据 。 这 种 服务 将 在 发 送 和 接收 进程 之 间 提 供 机 密 
性 ， 以 防 该 数据 以 某 种 方式 在 这 两 个 进程 之 间 被 观察 到 。 运 输 协 议 还 能 提供 除了 机 密 性 


以 外 的 其 他 安全 性 服务 ， 包 括 数据 完整 性 和 端点 鉴别 ， 我们 将 在 第 8 章 中 详细 讨论 这 些 
主题 。 


2. 1.4 因特网 提供 的 运输 服务 


至 此 ,我们 已 经 考虑 了 计算 机 网 络 能 够 一 般 性 地 提供 的 运输 服务 。 现 在 我 们 要 更 为 具 
体 地 考察 由 因特网 提供 的 运输 服务 类 型 。 因 特 网 (更 一 般 的 是 TCPAIP 网 络 ) 为 应 用 程 厅 
提供 两 个 运输 层 协议 ， 即 UDP 和 TCP。 当 你 (作为 一 个 软件 开发 者 ) 为 因特网 创建 一 个 
新 的 应 用 时 ， 首 先 要 做 出 的 决定 是 ， 选 择 UDP 还 是 选择 TCP。 每 个 协议 为 调用 它们 的 应 用 
程序 提供 了 不 同 的 服务 集合 。 网 2-4 显示 了 某 些 所 选 的 应 用 程序 的 服务 要 求 。 


应 用 数据 丢失 带宽 时 间 敏 感 













文件 传输 不 能 天 失 弹性 | 不 
电子 邮件 不 能 丢失 弹性 不 
Web 文档 不 能 丢失 弹性 (JL kbps) 不 


音频 (JL kbps ~ 1 Mbps) | 











因特网 电话 /视频 会 议 容忍 丢失 | 
视频 (10kbps ~ 5Mbps ) 


FUER 同上 i. JLB 





存储 音频 /视频 












交 五 式 游 戏 容忍 丢失 JL kbps ~ 10kbps 是 ，100ms 
RD Ay cA 弹性 是 和 不 是 


图 2-4 选择 的 网 络 应 用 的 要 求 


1. TCP 服务 

TCP 服务 模型 包括 面向 连接 服务 和 可 徘 数 据 传 输 服务 。 当 茶 个 应 用 程序 调用 TCP 作为 
其 运输 协议 时 ， 该 应 用 程序 就 能 获得 来 和 日 TCP 的 这 两 种 服务 。 

e 面向 连接 的 服务 : 在 应 用 层 数 据 报 文 开 始 流动 之 前 ，TCP 让 客户 和 服务 闫 互相 区 

换 运 输 层 控制 信息 。 这 个 所 谓 的 握手 过 程 提示 客户 和 服务 需 ， 使 它们 为 大 量 分 组 
的 到 来 做 好 准备 。 在 握手 阶段 后 ， 一 个 TCP 连接 (TCP connection) 就 在 两 个 进 
程 的 套 接 字 之 间 建 立 了 .这 条 连接 是 全 双 工 的 ， 即 连接 双方 的 进程 可 以 在 此 连接 
上 同时 进行 报 文 收发 。 当 应 用 程序 结束 报 文 发 送 时 ， 必 须 拆除 该 连接 。 在 第 3 章 
中 我 们 将 详细 讨论 面 各 连接 的 服务 ， 并 分 析 它 是 如 何 实现 的 。 

e 可 靠 的 数据 传送 服务 : 通信 进程 能 够 依 知 TCP， 无 差错 、 按 适当 顺序 交付 所 有 发 

送 的 数据 。 当 应 用 程序 的 一 端 将 字 节 流传 进 套 接 字 时 ， 它 能 够 依 徘 TCP 将 相同 的 
字 节 流 交 付 给 接收 方 的 套 接 字 ， 而 没有 字 节 的 丢失 和 元 余 ， 

TCP 协议 还 具有 拥塞 控制 机 制 ， 这 种 服务 不 一 定 能 为 通信 进程 市 来 直接 好 处 ,但 能 为 
因特网 市 来 整体 好 处 。 当 发 送 方 和 接收 方 之 间 的 网 络 出 现 拥 塞 时 ，TCP 的 拥塞 控制 机 制 会 
抑制 发 送 进程 〈 客 户 或 服务 部 ) 。 如 我 们 将 在 第 3 草 中 所 见 ，TCP 拥塞 控制 也 试图 限制 每 
个 TCP 连接 ， 使 它们 达到 公平 共享 网 络 市 宽 的 目的 。 
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无 论 TCP 还 是 UDP 都 没有 提供 任何 加 密 机 制 ， 这 就 是 说 发 送 进程 传 进 其 套 接 字 的 
数据 ， 与 经 网 络 传 送 到 目的 进程 的 数据 相同 。 因 此 ， 举 例 来 说 如 果 某 发 送 讲 程 以 明文 方 
A ( 即 没 有 加 密 ) 发 送 了 一 个 口令 进入 它 的 套 接 字 ， 该 明文 口令 将 经 过 发 送 方 与 接收 方 
之 间 的 所 有 链 路 传送 ， 这 就 可 能 在 任何 中 间 链 路 被 噢 探 和 发 现 。 因 为 隐私 和 其 他 安全 问 
题 对 许多 应 用 而 言 已 经 成 为 至 关 重要 的 问题 ， 所 以 因特网 界 已 经 研制 了 TCP 的 加 强 版 
本 ， 称 为 安全 套 接 字 层 (Secure Sockets Layer, SSL), JA SSL 加 强 后 的 TCP 不 仅 能 够 做 | 
传统 的 TCP 所 能 做 的 一 切 ， 而 且 提 供 了 关键 的 进程 到 进程 的 安全 性 服务 ， 包 括 加 客 、 数 ， 
据 完 整 性 和 端点 鉴别 。 我 们 强调 SSL 不 是 与 TCP 和 UDP 在 相同 层次 上 的 第 三 种 因特网 
运输 协议 ,而 是 一 种 对 TCP 的 加 强 ， 这 种 强化 是 在 应 用 层 上 实现 的 。 特 别 是 ， 如 果 一 个 
应 用 程序 要 使 用 SSL 的 服务 ， 它 需要 在 该 应 用 程序 的 客户 端 和 服务 器 端 包括 SSL 代码 
(利用 现 有 的 、 高 度 优化 的 库 和 类 )，。SSL 有 它 自 己 的 套 接 字 API， 这 类 似 于 传统 的 TCP 
套 接 字 API。 当 一 个 应 用 使 用 SSL 时 ， 发 送 进程 向 SSL 套 接 字 传 递 明 文 数据 ; 在 发 送 主 
机 中 的 SSL 则 加 窖 该 数据 并 将 加 密 的 数据 传递 给 TCP 套 接 字 。 加 窗 的 数据 经 因特网 传送 ， 
到 接收 进程 中 的 TCP 套 接 字 。 该 接收 套 接 字 将 加 密 数据 传递 给 SSL， 由 其 进行 解密 。 最 
后 ，SSL 通过 它 的 SSL 秦 接 字 将 明文 数据 传递 给 接收 进程 。 我 们 将 在 第 8 章 中 更 为 详细 
地 讨论 SSL. 


2. UDP 服务 

UDP 是 一 种 不 提供 不 必要 服务 的 轻 量 级 运输 协议 ， 它 仅 提 供 最 小 服务 。UDP 是 无 连 
接 的 ， 因 此 在 两 个 进程 通信 前 没有 握手 过 程 。UDP 协议 提供 一 种 不 可 靠 数据 传送 服务 ， 也 
就 是 说 ， 当 进程 将 一 个 报 文 发 送 进 UDP 套 接 字 时 ，UDP 协议 并 不 保证 该 报 文 将 到 达 接 收 
进程 。 不 仅 如 此 ， 到 达 接 收 进程 的 报 文 也 可 能 是 乱 序 到 达 的 。 

UDP 没有 包括 拥塞 控制 机 制 ， 所 以 UDP 的 发 送 端 可 以 用 它 选 定 的 任何 速率 向 其 下 层 
(网 络 层 ) 注入 数据 。( 然 而， 值得 注意 的 是 实际 闪 到 闪 厨 吐 量 可 能 小 于 这 种 速率 ， 这 可 
能 是 因为 中 间 链 路 的 带宽 受 限 或 因为 拥塞 而 造成 的 。) 

3. 因特网 运输 协议 所 不 提供 的 服务 

我 们 已 经 从 4 个 方面 组 织 了 运输 协议 服务 : 可 靠 数据 传输 、 和 吞吐 量 、 定 时 和 安全 性 。 
TCP 和 UDP 提供 了 这 些 服务 中 的 哪些 呢 ? 我 们 已 经 注意 到 TCP 提供 了 可 靠 的 端 到 端 数据 
传送 。 并 且 我 们 也 知道 TCP 在 应 用 层 可 以 很 容易 地 用 SSL 来 加 强 以 提供 安全 服务 。 但 在 我 
们 对 TCP 和 UDP 的 简要 描述 中 ， 明 显 地 缺少 了 对 否 吐 量 或 定时 保证 的 讨论 ， 即 这 些 服 务 
目前 的 因特网 运输 协议 并 没有 提供 。 这 是 否 意味 着 诸如 因特网 电话 这 样 的 时 间 敏 感应 用 不 
能 运行 在 今天 的 因特网 上 呢 ? 答案 显然 是 否定 的 ， 因 为 在 因特网 上 运行 时 间 敏 感应 用 已 经 
有 多 年 了 。 这 些 应 用 经 党 工作 得 相当 好 ， 因 为 它们 已 经 被 设计 成 尽 最 大 可 能 对 付 这 种 保证 
的 缺乏 。 我 们 将 在 第 7 章 中 研究 几 种 设计 技巧 。 无 论 如 何 ， 在 时 延 过 大 或 端 到 端 吞 吐 量 受 
限时 ， 好 的 设计 也 是 有 限制 的 。 总 之 , 今天 的 因特网 通 弟 能 够 为 时 间 敏 感应 用 提供 满意 的 
服务 ， 但 它 不 能 提供 任何 定时 或 市 宽 保 证 。 





图 2-5 指出 了 一 些 流行 的 因特网 应 用 所 使 用 的 运输 协议 。 可 以 看 到 ， 电 子 邮件 、 远 程 
终端 访问 、Web、 文 件 传 输 都 使 用 了 TCP,， 这 些 应 用 选择 TCP 的 最 主要 原因 是 TCP 提供 了 
可 笔 数 据 传输 服务 ， 确 保 所 有 数据 最 终 到 达 目 的 地 。 因 为 因特网 电话 应 用 Ca Skype) 通 
首 能 够 容 妨 某 些 丢失 但 要 求 达到 一 定 的 最 小 速率 才能 有 效 工 作 ， 所 以 内 特 网 电话 应 用 的 开 
发 者 通 委 愿意 将 该 应 用 运行 在 UDP 上 ， 从 而 设法 避 开 TCP 的 拥 老 控制 机 刺 和 分 组 开销 : 
但 因为 许多 防火 墙 被 配置 成 阻挡 〈 大 多 数 类 型 的 ) UDP 流量 ， 所 以 因特网 电话 应 用 通 稍 
设计 成 如 果 UDP 通信 失败 就 使 用 TCP 作为 备份 . 


。 应 用 层 协 议 






























电子 邮件 SMTP [ RFC 5321 ] 

远程 终端 访问 Telnet [ RFC 854 ] 

| Web HTTP | RFC 2616] | TCP | 
流 式 多 媒体 | HTTP (如 YouTube) | TCP 

| 因特网 电话 SIP [RFC 3261] 、RTP [RFC 3550) 或 专用 的 (如 Skype) | UDP ak TCP 





图 2-5 流行 的 因特网 应 用 及 其 应 用 层 协议 和 支撑 的 运输 协议 
2.1.5 应 用 层 协 议 


我 们 刚刚 学 习 了 通过 把 报 文 发 送 进 套 接 字 使 网 络 进 程 间 实现 相互 过 信 。 但 是 如 何 愧 造 
这 些 报 文 ” 在 这 些 报 文中 的 各 个 字段 的 含义 是 什么 ”进程 何 时 发 送 这 些 报 文 ”这 些 问题 将 
我 们 种 进 应 用 层 协 议 的 范围 。 应 用 层 协 议 ( application- layer protocol) 定义 了 运行 在 不 同 
疝 系 统 上 的 应 用 程序 进程 如 何 相互 传递 报 文 。 特 别 是 应 用 层 协议 定义 本: 

© 交换 的 报 文 类 型 ， 例 如 请 求 报 文 和 啊 应 报 文 。 

© 各 种 报 文 类 型 的 语法 ， 如 报 文中 的 各 个 字段 及 这 些 字 段 是 如 何 描述 的 。 

e 字段 的 语义 ， 即 这 些 字 段 中 包含 的 信息 的 含义 。 

。 一 个 进程 何 时 以 及 如 何 发 送 报 文 ， 对 报 文 进行 啊 应 的 规则 。 

有 些 应 用 层 协议 是 由 RFC 文档 定义 的 ， 因 此 它们 位 于 公共 域 中 。 例 如 ，Web 的 应 用 
层 协议 HTTP ( 超 文 本 传输 协议 [RFC 2616] ) 就 作为 一 个 RFC FY EGER. WRN OE ae IP 
发 者 遵从 HTTP REC 规则 ， 所 开发 出 的 浏览 器 就 能 访问 任何 遵从 该 文档 标准 的 Web IRI AF 
并 获取 相应 Web 页 面 。 还 有 很 多 别 的 应 用 层 协议 是 专用 的 ， 有 意 不 为 公共 域 使 用 .例如 ， 
Skype 使 用 了 专用 的 应 用 层 协 议 ， 

区 分 网 络 应 用 和 应 用 层 协 议 是 很 重要 的 。 应 用 层 协议 只 是 网 络 应 用 的 一 部 分 〈 尽 管 从 
我 们 的 角度 看 ， 它 是 应 用 非常 重要 的 一 部 分 ) 。 我 们 来 看 一 些 例 子 。Web 是 一 种 客户 - 服 
务 需 应 用 ， 它 允许 客户 按照 需求 从 Web 服务 器 获得 文档 。 该 Web 应 用 有 很 多 组 成 部 分 ， 
包括 文档 格式 的 标准 ( 即 HTML), Web 浏览 句 (如 Firefox 和 Microsoft Internet Explorer) 、 
Web 服务 器 (如 Apache, Microsoft 服务 器 程序 ) ， 以 及 一 个 应 用 层 协议 。Web 的 应 用 层 协 
议 是 HTTP， 它 定义 了 在 浏览 器 和 Web 服务 器 之 间 传 输 的 报 文 格式 和 序列 。 因 此 ，HTTP 
只 是 Web 应 用 的 一 个 部 分 (尽管 是 重要 部 分 ) 。 举 另外 一 个 例子 ， 因 特 网 电子 邮件 应 用 也 
有 很 多 组 成 部 分 ， 包括 能 容纳 用 户 邮 箱 的 邮件 服务 器 、 人 允许 用 户 读 取 和 生成 邮件 的 邮件 客 
户 程 序 (如 Microsoft Outlook ) 、 定 义 电子 邮件 报 文 结构 的 标准 、 定 义 报 文 如 何在 服务 带 之 
间 以 及 如 何在 服务 需 与 邮件 客户 程序 之 间 传 递 的 应 用 层 协议 、 定 义 如 何 对 报 文 首 部 的 内 容 
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进行 解释 的 应 用 层 协 议 。 用 于 电子 邮件 的 主要 应 用 层 协议 就 是 SMTP (简单 邮件 传输 协议 
LRFC5321] )。 因 此 ， 电 子 邮 件 的 首要 应 用 层 协 议 SMTP 也 只 是 电子 邮件 应 用 的 一 个 部 分 
(尽管 是 重要 部 分 ) 。 


2.1.6 本 书 涉及 的 网 络 应 用 


每 天 部 有 新 的 公共 域 或 者 专用 域 因 特 网 应 用 被 开发 出 来 。 我 们 不 愿 像 百 科 全 书 一 样 涉 
及 大 量 的 因特网 应 用 ， 而 是 选择 其 中 几 种 重要 而 流行 的 应 用 加 以 关注 。 在 本 草 中 我 们 详细 
讨论 5 种 重要 的 应 用 : Web、 文 件 传 输 、 电 子 邮 件 、 目 录 服 务 和 P2P。 我 们 首先 讨论 Web 
应 用 ， 不 仅 因 为 它 是 极为 流行 的 应 用 ， 而 且 因为 它 的 应 用 层 协 议 HTTP 相对 比较 简单 并 且 
多 于 理解 .讨论 完 Web， 我们 人 简要 地 讨论 FTP, AAE HTTP 形成 了 很 好 的 对 照 。 我 们 
接 下 来 讨论 电子 邮件 应 用 ， 这 是 因特网 上 最 早 的 招 人 喜爱 的 应 用 程序 。 说 电子 邮件 比 Web 
更 复杂 ， 是 因为 它 使 用 了 多 个 而 不 是 一 个 应 用 层 协议 。 在 电子 邮件 之 后 ， 我 们 讨论 DNS, 
它 为 因特网 提供 目录 服务 。 大 多 数 用 户 不 直接 与 DNS 打交道 ， 而 是 通过 其 他 的 应 用 ( 包 
fh Web 、 文 件 传输 和 电子 邮件 ) 间接 使 用 它 。DNS 很 好 地 说 明了 一 种 核心 的 网 络 功能 
(网 络 名 字 到 网 络 地 址 的 转换 ) 是 怎样 在 因特网 的 应 用 层 实 现 的 。 本 章 最 后 我 们 讨论 了 几 
种 P2P 应 用 ,重点 关注 文件 共享 应 用 、 分 布 式 查找 服务 。 在 第 7 草 中 ,我 们 将 涉及 多 媒体 
应 用 ， 包 括 流 式 视 频 和 IP 电话 。 


2.2 Web 和 HTTP 


20 {H 2e 90 年 代 以 前 ， 因 特 网 的 主要 使 用 者 还 是 研究 人 员 、 学 者 和 大 学 生 ， 他 们 登 
录 远 程 主 机 ， 在 本 地 主机 和 远程 主机 之 间 传 输 文 件 ， 收 发 新 闻 ， 收 发 电子 邮件 。 尽 管 这 
些 应 用 非常 有 用 (并且 继 续 如 此 ), 但 是 因特网 基本 上 不 为 学 术 界 和 人 研究 界 之 外 所 知 。 
到 了 20 世纪 90 年 代 初 期 一 个 主要 的 新 型 应 用 即 万 维 网 (World Wide Web) 登 上 了 舞台 
| Berners-Lee 1994]. Web 是 一 个 引起 公众 注意 的 因特网 应 用 ， 它 极 大 地 改变 了 人 们 与 工 
作 环 境内 外 交流 的 方式 。 它 将 因特网 从 只 是 很 多 数据 网 之 一 的 地 位 提升 为 仅 有 的 一 个 数 
据 网 。 

也 许 对 大 多 数 用 户 来 说 ， 最 具有 吸引 力 的 就 是 Web 的 按 需 操作 。 当 用 户 需 要 时 ， 就 
能 得 到 所 想 要 的 内 容 。 这 不 同 于 无 线 电 广 播 和 电视 ， 迫 使 用 户 只 能 收听 、 收 看 内 容 提供 者 
提供 的 节目 。 除 了 可 以 按 需 操作 以 外 ，Web 还 有 很 多 让 人 们 喜欢 和 珍爱 的 特性 。 任 何人 使 
RSE Web 上 可 用 都 非常 简单 ， 即 只 需要 极 低 的 费用 就 能 成 为 出 版 人 。 超 链接 和 搜索 引 
擎 帮助 我 们 在 Web 站 点 的 海洋 里 导航 。 图 形 化 的 界面 刺激 着 我 们 的 感官 。 表 单 Java 小 程 
序 和 很 多 其 他 的 装置 ， 使 我 们 可 以 与 Web 页 面 和 站 点 进行 交互 。 并 且 Web 为 许多 在 2003 
年 以 后 出 现 的 招 人 喜爱 的 应 用 提供 了 平台 ， 这 些 应 用 包括 YouTube, Gmail 和 Face book 
(脸谱 ) 。 


2.2.1 HTTP HR 


Web 的 应 用 层 协 议 是 超 文本 传输 协议 (HyperText Transfer Protocol, HTTP), € Web 
的 核心 ， 在 [RFC 1945] 和 [RFC 2616] 中 进行 了 定义 。HTTP 由 两 个 程序 实现 : 一 个 客 
户 程序 和 一 个 服务 器 程序 。 客 户 程序 和 服务 器 程序 运行 在 不 同 的 端 系统 中 ， 通 过 交换 
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HTTP 报 文 进 行 会 话 。HTTP EX T AEIR YB HY LA Be E P AR 9 ait GE AT FRR SCE RY 7 
式 。 在 详细 解释 HTTP 之 前 ， 应 当 回 顾 某 些 Web 术语 。 

Web 页 面 (Web page) (也 叫 文档 ) 是 由 对 象 组 成 的 。 一 个 对 象 (object) 只 是 一 个 
文件 ， 诸 如 一 个 HTML 文件 、 一 个 JPEG 图 形 、 一 个 Java 小 程序 或 一 个 视频 片段 这 样 的 文 
件 ， 且 它们 可 通过 一 个 URL 地 址 寻 址 :多数 Web 页 面 含 有 一 个 HTML 基本 文件 (base 
HTML file) 以 及 几 个 引用 对 象 。 例 如 ， 如 果 一 个 Web 页 面包 含 HTML 文本 和 5 A JPEG 图 
形 ， 那 么 这 个 Web 页 面 有 6 个 对 象 : 一 个 HTML 基本 文件 加 5 个 图 形 。HTML 基本 文件 通 
过 对 象 的 URL 地 址 引用 页 面 中 的 其 他 对 象 。 每 个 URL 地 址 由 两 部 分 组 成 : 存放 对 象 的 服 
SA E HLA AM BAY EY. lan, URL 地 址 http://www. someSchool. edu/someDepart- 
ment/picture. sf， 其 中 的 www. someSchool. edu 就 是 主机 名 ，/someDepartment picture. gif 就 
EMRA., KAA Web 浏览 器 (Web oi (例如 Internet Explorer 和 Firefox) 实现 了 
HTTP 的 客户 端 ， 所 以 在 Web 环境 中 我 们 经 常 交 蔡 使 用 “浏览 器 ”和 “客户 ”这 两 个 术 
Hro Web 服务 器 (Web server) 实现 了 HTTP IRS tein, EAL At Web 对 象 ， 每 个 对 
rh URL 寻 址 。 流行 的 Web 服务 器 有 Apache 和 Microsoft Internet Information Server (做 软 


互联 网 信息 P Fl fik 务 fe) i iZ íT Apache Web 


HTTP 定义 了 Web 客户 回 Web IR 4 Arik IRA ee IAR Fa 
Web 页 Ay 77st, VA Ae hile I Ar Pe IK Web E 
HEWER, RIA IE EATE & PP RI A 
的 交互 过 程 ， 而 其 基本 思想 在 图 2-6 中 进行 了 
图 示 。 当 用 户 请 求 一 个 Web 页 面 〈《 如 点 击 一 个 
超 链接 ) 时 ， 浏 览 器 向 服务 需 发 出 对 该 页 面 中 
所 包含 对 象 的 HTTP 请 求 报 文 ， 服 务 震 接收 到 
请 求 并 用 包含 这 些 对 象 的 AT TP 响应 报 文 进行 





fe] iv. 运行 Intemet 运行 Firefox 
HTTP 使 用 TCP 作为 它 的 文 撑 运 输 协 议 ”Explorer 的 PC 的 Linux 
(而 不 是 在 UDP 上 运行 )。HTTP 客户 首先 发 起 图 2-6 HTTP 的 请 求 - 响应 行为 


一 个 与 服务 器 的 TCP 连接 。 一旦 连接 建立 ， 该 
浏览 器 和 服务 器 进程 就 可 以 通过 套 接 字 接口 访问 TCP。 如 同 在 2.1 节 中 描述 的 那样 客户 
端的 套 接 字 接口 是 客户 进程 与 TCP 连接 之 间 的 门 ， 在 服务 需 端 的 套 接 字 接口 则 是 服务 需 进 
程 与 TCP 连接 之 间 的 门 。 客 户 同 它 的 套 接 字 接口 发 送 HTTP 请 求 报 文 并 从 它 的 套 接 字 接 口 
接收 HTTP 响应 报 文 。 类 似 地 ， 服 务 咒 从 它 的 套 接 字 接 口 接收 HTTP 请 求 报 文 和 回 它 的 套 
接 字 接口 发 送 HTTP 响应 报 文 . 一 旦 客户 向 它 的 套 接 字 接口 发 送 了 一 个 请 求 报 文 ， 该 报 文 
就 脱离 了 客户 控制 并 进入 TCP 的 控制 。2. 1 节 讲 过 ，TCP 为 HTTP 提供 可 靠 数 据 传输 服务 . 

这 意味 着 ， 一 个 客户 进程 发 出 的 每 个 HTTP 请 求 报 文 最 终 能 完整 地 到 达 服 务 器 ; 类 似 地 ， 
服务 器 进程 发 出 的 每 个 HTTP 响应 报 文 最 终 能 完整 地 到 达 客 户 。 这 里 我 们 看 到 了 分 层 体系 
结构 最 大 的 优点 ， 即 HTTP 协议 不 用 担心 数据 丢失 ， 也 不 关注 TCP 从 网 络 的 数据 丢失 和 乱 
序 故障 中 恢复 的 细节 。 那 是 TCP 以 及 协议 栈 较 低层 协议 的 工作 ， 

注意 到 下 列 现象 很 重要 ， 服务 器 向 客户 发 送 被 请 求 的 文件 ， 而 不 存储 任何 关于 该 客户 
的 状态 信息 。 假 如 某 个 特定 的 客户 在 短 短 的 几 秒 钟 内 两 次 请 求 同 一 个 对 象 ， 服 务 器 并 不 会 
因为 刚刚 为 该 客户 提供 了 该 对 象 就 不 青 做 出 反应 ， 而 是 重新 发 送 该 对 象 ， 就 像 服 务 器 已 经 
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完全 忘记 不 久之 前 所 做 过 的 事 一 样 。 因 为 HTTP 服务 器 并 不 保存 关于 客户 的 任何 信息 ， 所 
以 我 们 说 HTTP 是 一 个 无 状态 协议 (stateless protocol ) 。 我 们 同时 也 注意 到 Web 使 用 了 客 
户 -服务 天 应 用 程序 体系 结构 (如 2. 1 节 所 述 ) 。Web 服务 器 总 是 打开 的 ， 具 有 一 个 固定 
的 JP 地址 ， 且 它 服务 于 可 能 来 日 数 以 百 万 计 的 不 同 浏览 右 的 请 求 。 


2.2.2 非 持 续 连接 和 持续 连接 


在 许多 因特网 应 用 程序 中 ， 客 户 和 服务 需 在 一 个 相当 长 的 时 间 范 围 内 通信 ， 其 中 客户 
发 出 一 系列 请 求 并 且 服 务 右 对 每 个 请 求 进行 响应 。 依 据 应 用 程序 以 及 该 应 用 程序 的 使 用 方 
式 ， 这 一 系列 请 求 可 以 以 规则 的 间隔 周期 性 地 或 者 间断 性 地 一 个 接 一 个 发 出 。 当 这 种 客户 
-服务 硕 的 交互 是 经 TCP 进行 的 ， 应 用 程序 的 研制 者 就 需要 做 一 个 重要 决定 ， 即 每 个 请 求 
/ 啊 应 对 是 经 一 个 单独 的 TCP 连接 发 送 ， 还 是 所 有 的 请 求 及 其 啊 应 经 相同 的 TCP 连接 发 送 
ME? 采用 前 一 种 方法 ， 该 应 用 程序 被 称 为 使 用 非 持续 连接 (non- persistent connection); 采 
用 后 一 种 方法 ， 该 应 用 程序 被 称 为 使 用 持续 连接 (persistent connection) 。 为 了 深入 地 理解 
该 设计 问题 ， 我 们 研究 在 特定 的 应 用 程序 即 HTTP 的 情况 下 持续 连接 的 优点 和 缺点 ，HTTP 
既 能 够 使 用 非 持 续 连 接 ， 也 能 够 使 用 持续 连接 。 尺 管 HTTP 在 其 默认 方式 下 使 用 持续 连 
fe, HTTP 客户 和 服务 融 也 能 配置 成 使 用 非 持 续 连 接 。 

1. 采用 非 持续 连接 的 HTTP 

我 们 看 看 在 非 持 续 连 接 情况 下 ， 从 服务 器 向 客户 传送 一 个 Web 页 面 的 步骤。 假设 该 
页 面 含 有 一 个 HTML 基本 文件 和 10 个 JPEG 图 形 ， 并 且 这 11 个 对 象 位 于 同一 台 服 务 器 上 。 
该 HTML 文件 的 URL 为 : http://www. someSchool. edu/someDepartment/home. index, 

我 们 看 看 发 生 了 什么 情况 : 

e HTTP 客户 进程 在 端口 号 80 发 起 一 个 到 服务 器 www. someSchool. edu 的 TCP 连接 ， 
Avg sae HTTP 的 黑 认 应 口 。 在 客户 和 服务 器 上 分 别 有 一 个 套 接 字 与 该 连接 相 
关联 。 

。 HTTP 客户 经 它 的 套 接 字 问 该 服务 器 发 送 一 个 HTTP 请 求 报 文 。 请 求 报 文 中 包含 了 
路 径 名 /someDepartment/home. index (后 面 我 们 会 详细 讨论 HTTP 报 文 )。 

e HTTP 服务 顺 进 程 经 它 的 套 接 字 接收 该 请 求 报 文 ， 从 其 存储 器 CRAM 或 磁盘 ) 中 
检索 出 对 象 www. someSchool. edu/someDepartment/home. index， 在 一 个 HTTP 响应 
报 文中 封 沪 对 象 ， 并 通过 其 套 接 字 同 客 户 发 送 啊 应 报 文 。 

e HTTP 服务 兹 进程 通知 TCP 断 开 该 TCP 连接 。( 但 是 直到 TCP 确认 客户 已 经 完整 地 
收 到 啊 应 报 文 为 止 ， 它 才 会 实际 中 断 连 接 ,) 

。 HTTP 客户 接收 啊 应 报 文 ，TCP 连接 关闭 。 该 报 文 指出 封装 的 对 象 是 一 个 HTML X 
件 ， 客 尸 从 啊 应 报 文 中 提取 出 该 文件 ， 检 查 该 HTML 文件 ， 得 到 对 10 个 JPEG 图 
形 的 引用 。 

o 对 每 个 引用 的 JPEG 图 形 对 象 重复 前 4 个 步骤 。 

SA aE Web 页 面 后 ， 显 示 给 用 户 。 两 个 不 同 的 浏览 器 也 许 会 以 不 同 的 方式 解 
(MMP aa) 该 页 面 。HTTP 与 客户 如 何 解释 一 个 Web 页 面 毫 无 关系 。HTTP 规范 
( [RFC 1945] 和 | RFC 2616]) 仅 定 义 了 在 HTTP 客户 程序 与 ATTP 服务 器 程序 之 间 的 通 
信 协 议 。 
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上 面 的 步骤 举例 说 明了 非 持 续 连 接 的 使 用 ， 其 中 每 个 TCP EIERS A AIK Ae ha 
关闭 ， 即 该 连接 并 不 为 其 他 的 对 象 而 持续 下 来 。 值 得 注意 的 是 每 个 TCP 连接 只 传输 一 个 请 求 
报 文 和 一 个 响应 报 文 。 因 此 在 本 例 中 ， 当 用 户 请 求 该 Web 页 面 时 ， 要 产生 11 个 TCP 连接 . 

在 上 面 描述 的 步骤 中 ， 我 们 有 意 没 有 明确 客户 获得 这 10 个 JPEG 图 形 对 象 是 使 用 10 
个 串 行 的 TCP 连接 ， 还 是 某 些 JPEG 对 象 使 用 了 一 些 并 行 的 TCP 连接 。 事 实 上 ， 用 户 能 够 
配置 现代 浏览 融 以 控制 并 行 度 。 在 默认 方式 下 ， 大 部 分 浏览 右 打 开 S ~ 10 个 并 行 的 TCP 连 
接 ， 而 每 条 连接 处 理 一 个 请 求 响 应 事务 。 如 果 有 几 户 愿意 ， 最 大 并 行 连接 数 可 以 设 罩 为 1， 
这 样 10 条 连接 就 会 串 行 建立 。 我 们 在 下 一 章 会 看 到 ， 使 用 并 行 连接 可 以 缩短 啊 应 时 间 

在 继续 讨论 之 前 ， 我 们 来 简单 估算 一 下 从 客户 请 求 HTML 基本 文件 起 到 该 客户 收 到 整 
个 文件 止 所 花费 的 时 间 。 为 此 ， 我 们 给 出 往返 时 间 (Round-Trp Time, RTT) 的 定义 ,该 
时 间 是 指 一 个 短 分 组 从 客户 到 服务 器 然后 再 返回 客户 所 花费 的 时 间 .，RTT 包括 分 组 传播 时 
延 、 分 组 在 中 间 路 由 器 和 交换 机 上 的 排队 时 延 以 及 分 组 处 理 时 延 (这 些 在 1.4 节 已 经 讨论 
过 )。 现 在 考虑 当 用 户 点 击 超 链接 时 会 发 生 什么 现象 。 如 图 2-7 所 示 ， 这 引起 浏览 融 在 它 
和 Web 服务 器 之 间 发 起 一 个 TCP 连接 ; 这 涉及 一 次 “三 次 握手 ”过 程 ， 即 客户 向 服务 器 
发 送 一 个 小 TCP 报 文 段 ， 服 务 器 用 一 个 小 TCP 报 文 段 做 出 确认 和 响应， 最 后 ， 客 户 问 服 
务 融 返回 确认 。 三 次 握手 中 前 两 个 部 分 所 耗费 的 时 间 占 用 了 一 个 RTT. 完成 了 三 次 握手 的 
前 两 个 部 分 后 ， 客 户 结合 三 次 握手 的 第 三 部 分 (确认 ) 回 该 TCP 连接 发 送 一 个 HTTP 请 求 
报 文 。 一 旦 该 请 求 报 文 到 达 服 务 般 ， 服 务 器 就 在 该 TCP 连接 上 发 送 HTML 文件 ,该 HTTP 
请 求 / 响 应 用 去 了 男 一 个 RTT- 因此 ， 粗 略 地 讲 ， 总 的 啊 应 时 间 就 是 两 个 RTT 加 上 服务 带 
传输 HTML 文件 的 时 间 . 








E 


上 传输 文件 的 时 间 


4 


RITH 3 ~ ; 


接收 整个 文件 二 : my es 


> Y 
客户 的 时 间 服务 器 的 时 间 
图 2-7 请 求 并 接收 一 个 HTML 文件 所 需 的 时 间 佑 算 


2. 采用 持续 连接 的 HTTP 
非 持续 连接 有 一 些 缺 点 。 首 先 ， 必 须 为 每 一 个 请 求 的 对 象 建立 和 维护 一 个 全 新 的 连 
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ik. 对 于 每 个 这 样 的 连接 ， 在 客户 和 服务 需 中 部 要 分 配 TCP 的 缓冲 区 和 保持 TCP 变量 

这 给 Web 服务 融 带 来 了 严重 的 负担 ， 因 为 一 台 Web 服务 器 可 能 同时 服务 于 数 以 百 HR ij 
的 客户 的 请 求 。 第 二 ， 就 像 我 们 刚 描述 的 那样 ， 每 一 个 对 象 经 受 两 倍 RTT 的 交付 时 延 ， 
即 一 个 RTT 用 于 创建 TCP， 另 一 个 RTT 用 于 请 求 和 接收 一 个 对 象 。 

在 采用 持续 连接 的 情况 下 ， 服 务 需 在 发 送 啊 应 后 保持 该 TCP 连接 打开 。 在 相同 的 客户 
与 服务 带 之 间 的 后 续 请 求 和 响应 报 文 能 够 通过 相同 的 连接 进行 传送 。 特 别 是 ， 一 个 完整 的 
Web 页 面 (上 例 中 的 HTML 基本 文件 加 上 10 个 图 形 ) 可 以 用 单个 持续 TCP 连接 进行 传 
送 。 更 有 甚 者 ， 位 于 同一 台 服 务 需 的 多 个 Web 页 面 在 从 该 服务 器 发 送 给 同一 个 客户 时 ， 
可 以 在 单个 持续 TCP 连接 上 进行 。 可 以 一 个 接 一 个 地 发 出 对 对 象 的 这 些 请 求 ， 而 不 必 等 待 
对 未 决 请 求 〔 流 水 线 ) 的 回答 。 一 般 来 说 ， 如 果 一 条 连接 经 过 一 定时 间 间 隔 (一 个 可 配 
置 的 超时 间隔 ) 仍 未 被 使 用 ，HTTP 服务 需 就 关闭 该 连接 。HTTP 的 默认 模式 是 使 用 带 流 
水 线 的 持续 连接 。 我 们 把 量化 比较 持续 连接 和 非 持 续 连 接 性 能 的 任务 留 作 第 2、3 章 的 课 

后 习题 。 鼓 励 读者 阅读 文献 | Heidemann 1997; Nielsen 1997 | 。 


2.2.3 HTTP 报 文 格式 


HTTP 规范 [ RFC 1945; RFC 2616] 包含 了 对 HTTP 报 文 格式 的 定义 。HTTP 报 文 有 
两 种 : 请求 报 文 和 啊 应 报 文 。 下 和 面 讨论 这 两 种 报 文 。 

1. HTTP 请 求 报 文 

下 面 提供 了 一 个 典型 的 HTTP 请 求 报 文 

GET /somedir/page.html HTTP/1.1 

Host: www.someschool.edu 

Connection: close 


User-agent: Mozilla/5.0 
Accept-language: fr 


通过 仔细 观察 这 个 简单 的 请 求 报 文 ， 我 们 就 能 知道 很 多 东西 。 首 先 ， 我 们 看 到 该 报 文 
是 用 普通 的 ASCII 文本 书写 的 ， 这样 有 一 定 计算 机 知识 的 人 都 能 够 阅读 它 。 其 次 ， 我们 看 
到 该 报 文 由 5 行 组 成 ， 每 行 由 一 个 回 车 和 换行 符 结 束 。 最 后 一 行 后 青 附 加 一 个 回 车 换行 
符 。 虽然 这 个 特定 的 报 文 仅 有 5 行 ， 但 一 个 请 求 报 文 能 够 具有 更 多 的 行 或 者 至 少 为 一 行 。 
HTTP 请 求 报 文 的 第 一 行 叫 做 请 求 行 (request line), HJA Hk n oF 叫做 首部 行 (header 
line) 。 请 求 行 有 3 个 字段 : MEFR., URL 字段 和 HTTP 版 本 字段 。 方 法 字段 可 以 取 几 种 
不 同 的 值 ， 包 括 GET, POST, HEAD, PUT 和 DELETE 。 BARG HTTP 请 求 报 文 使 用 
GET 方法 . 当 浏 览 郑 请 求 一 个 对 象 时 ， 使 用 GET 方法 ， 在 URL 字段 带 有 请 求 对 象 的 标识 。 
在 本 例 中 ， 该 浏览 器 正在 请 求 对 象 /somedirpage. html。 其 版 本 字段 是 自 解释 的 ; 在 本 例 
中 ， 浏 览 锅 实现 的 是 HTTP/1. 1 版 本 。 

现在 我 们 看 看 本 例 的 首部 行 。 首 部 行 Host: www. someschool. edu 指明 了 对 象 所 在 的 
主机 。 你 也 许 认 为 该 首部 行 是 不 必要 的 ， 因 为 在 该 主机 中 已 经 有 一 条 TCP 连接 存在 了 ， 
"i 如 我 们 将 在 2. 2.5 节 中 所 见 ， ARE as 是 Web 代理 高 速 缓存 所 要 求 

-通过 包含 Connection; close 首部 行 ， 该 浏览 融 告 诉 服务 严 不 希望 及 烦 地 使 用 持续 连 
它 要 求 服务 天 在 发 送 完 被 请 求 的 对 象 后 就 关闭 这 条 连接 。User-agent: 首部 行 用 来 
指明 用 户 代 理 ， 即 回 服务 需 发 送 请 求 的 浏览 器 的 类 型 。 这 里 浏览 器 类 型 是 Mozilla/5. 0, 
HI Firefox 浏览 硕 。 这 个 首部 行 是 有 用 的 ， 因 为 服务 需 可 以 有 效 地 为 不 同类 型 的 用 户 代理 
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实际 发 送 相同 对 象 的 不 同 版 本 。 (每 个 版 本 都 由 相同 的 URL ek.) 最 后 ，Accept-lan- 
guage: 首部 行 表 示 用 户 想得到 该 对 象 的 法 语 版 本 (如 果 服 务 器 中 有 这 样 的 对 象 的 话 ) ; 
人 否则， 服务 器 应 当 发 送 它 的 默认 版 本 。Accept-language: 首部 行 仅 是 HTTP 中 可 用 的 众 
多 内 容 协 商 首 部 之 一 ， 

看 过 一 个 例子 之 后 ,我们 再 来 看 看 如 图 2-8 所 示 的 一 个 请 求 报 文 的 通用 格式 。 我 们 看 
到 该 通用 格式 与 我 们 前 面 的 例子 密切 对 应 。 然 而 ， 你 可 能 已 经 注意 到 了 在 首部 行 《( 和 附加 
的 回 车 和 换行 ) 后 有 一 个 “实体 体 ”(entity body) 。 使 用 GET 方法 时 实体 体 为 空 ， 而 使 用 
POST 方法 时 才 使 用 该 实体 体 。 当 用 户 提交 表单 时 ，HTTP 客户 常常 使 用 POST 方法 ,例如 
当 用 户 向 搜索 引擎 提供 搜索 关键 词 时 。 使 用 POST 报 文 时 ， 用 户 仍 可 以 回 服务 需 请 求 一 个 
Web 页 面 ， 但 Web 页 面 的 特定 内 容 依赖 于 用 户 在 表单 字段 中 输入 的 内 容 。 如 有 果 方 法 字段 
的 值 为 POST 时 ， 则 实体 体 中 包含 的 就 是 用 户 在 表单 字段 中 的 输入 值 . 





图 2-8 一 个 HTTP 请 求 报 文 的 通用 格式 


当然 ， 如 果 不 提 “用 表单 生成 的 请 求 报 文 不 是 必须 使 用 POST 方法 ”这 一 点 ， 那 将 是 
失职 。HTML 表单 经 常 使 用 GET 方法 ， 并 在 〈 表 单字 段 中 ) 所 请 求 的 URL eas 
数据 。 例 如 ， 一 个 表单 使 用 CET 方法 ， 它 有 两 个 字段 ， 分 别 填 写 的 是 “monkeys” 和 
“bananas”， 这 样 ， 该 URL 结构 为 www. somesite. com/animalsearch? monkeys&bananas。 在 
日 复 一 日 的 网 上 冲浪 中 ， 你 也 许 已 经 留意 到 了 这 种 扩展 的 URL, 

HEAD 方法 类 似 于 GET 方法 。 当 服务 需 收 到 使 用 HEAD 方法 的 请 求 时 ， 将 会 用 一 
HTTP 报 文 进行 响应 ， 但 是 并 不 返回 请 求 对 象 。 应 用 程序 开发 者 常用 HEAD 方法 进行 调试 
跟踪 。PUT 方法 常 与 Web 发 行 工具 联合 使 用 ， 它 允许 用 户 上 传 对 象 到 指定 的 Web 服务 各 
上 指定 的 路 径 (目录 )。PUT 方法 也 被 那些 需要 癌 Web 服务 关上 传 对 象 的 应 用 程序 使 用 ， 
DELETE 方法 允许 用 户 或 者 应 用 程序 删除 Web 服务 右上 的 对 象 。 

2. HTTP 响应 报 文 

下 面 我 们 提供 了 一 条 典型 的 HTTP 啊 应 报 文 。 该 啊 应 报 文 可 以 是 对 刚刚 讨论 的 例子 中 
请 求 报 文 的 啊 应 。 


HTTP/1.1 200 OK 
Connection: close 
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Date: Tue, 09 Aug 2011 15:44:04 GMT 

Server: Apache/2.2.3 (CentOS) 

Last-Modified: Tue, 09 Aug 2011 15:11:03 GMT 
Content-Length: 6821 

Content-Type: text/html 


(data data data data data ...) 

我 们 仔细 看 一 下 这 个 响应 报 文 。 它 有 三 个 部 分 : 一 个 初始 状态 行 (status line), 6 个 
首部 行 (header line ) ， 然 后 是 实体 体 (entity body) 。 实 体 体 部 分 是 报 文 的 主要 部 分 ， 即 它 
也 含 了 所 请 求 的 对 象 本 身 (表示 为 data data data data). 状态 行 有 3 个 字段 : 协议 版 本 
字段 、 状 态 码 和 相应 状态 信息 。 在 这 个 例子 中 ， 状 态 行 指示 服务 器 正 在 使 用 HTTPZ1. 1， 
并 是 一切 正常 ( 即 服务 器 已 经 找到 并 正在 发 送 所 请 求 的 对 象 ) 。 

我 们 现在 来 看 看 首部 行 。 服 务 器 用 Connection; close 首部 行 告 诉 客户 ， 发 送 完 报 文 后 
将 关闭 该 TCP 连接 。Date: 首部 行 指 示 服 务 需 产生 并 发 送 该 啊 应 报 文 的 日 期 和 时 间 。 值得 
一 提 的 是 ， 这 个 时 间 不 是 指 对 象 创建 或 者 最 后 修改 的 时 间 ; 而 是 服务 需 从 它 的 文件 系统 中 
检索 到 该 对 象 ， 搬 入 到 啊 应 报 文 ， 并 发 送 该 啊 应 报 文 的 时 间 。sServer: 首部 行 指 示 该 报 文 
是 由 一 台 Apache Web 服务 需 产 生 的 ， 它 类 似 于 HTTP 请 求 报 文中 的 User-agent: 首部 行 。 
Last- Modified: 首部 行 指 示 了 对 象 创 建 或 者 最 后 修改 的 日 期 和 时 间 。Last- Modified: 首部 行 
对 既 可 能 在 本 地 客户 也 可 能 在 网 络 缓存 服务 名 上 的 对 象 缓存 来 说 非常 重要 。 我们 将 很 快 详 
细 地 讨论 缓存 服务 器 (ALY (RAR SF ab). Content-Length; 痛 部 行 指示 了 被 发 送 对 象 中 的 
字 节 数 。Content-Type: 首部 行 指示 了 实体 体 中 的 对 象 是 HTML 文本 。，( 该 对 象 类 型 应 该 正 
式 地 由 Content-Type: 首部 行 而 不 是 用 文件 扩展 名 来 指示 。) 


So, 


首部 行 





图 2-9 一 个 HTTP 啊 应 报 文 的 通用 格式 


看 过 一 个 例子 后 ， 我 们 再 来 查看 啊 应 报 文 的 通用 格式 ( 如 图 2-9 所 示 )。 该 通用 格式 
能 够 与 前 面 例子 中 的 响应 报 文 对 应 起 来 。 我 们 补充 说 明 一 下 状态 码 和 它们 对 应 的 短语 。 状 
态 人 码 及 其 相应 的 短语 指示 了 请 求 的 结果 。 一 些 第 见 的 状态 人 码 和 相关 的 短语 包括 : 
e 200 OK: 请 求 成 功 ， 信 息 在 返回 的 响应 报 文中 。 
e 301 Moved Permanently: 请 求 的 对 象 已 经 被 永久 转移 了 了， 新 的 URL 定义 在 啊 应 报 
文 的 Location; 首部 行 中 。 客 户 软件 将 目 动 获取 新 的 URL. 
e 400 Bad Request; 一 个 通用 差错 代码 ， 指 示 该 请 求 不 能 被 服务 带 理 解 。 
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e 404 Not Found; 被 请 求 的 文档 不 在 服务 大 上 。 

e 505 HTTP Version Not Supported: 服务 需 不 支持 请 求 报 文 使 用 的 HTTP 协议 版 本 ， 

你 想 看 一 下 真实 的 HTTP 啊 应 报 文 吗 ? 这 正 是 我 们 高 度 推荐 的 事 ， 而 且 也 很 容易 做 
Fj, HiH Telnet 登录 到 你 喜欢 的 Web 服务 闫 上 ， 接 下 来 输入 一 个 只 有 一 行 的 请 求 报 文 去 
请 求 放 在 该 服务 融 上 的 某 些 对 象 。 例 如 ， 假 设 你 看 到 命令 提示 ， 键 人 : 

telnet cis.poly.edu 80 


GET /~ross/ HTTP/1.1 
Host: cis.poly.edu 


(在 输入 最 后 一 行 后 连续 按 两 次 回 车 。) 这 就 打开 一 个 到 主机 cis. poly. edu 的 80 ti HO AY TCP 
连接 ， 并 发 送 一 个 HTTP 请 求 报 文 。 你 将 会 看 到 一 个 携 市 包括 Ross 教授 主页 的 HTML 基本 文 
件 的 啊 应 报 文 。 如 果 你 只 是 想 看 一 下 HTTP 协议 的 报 文 行 ， 而 不 是 获取 对 象 本 映 的 话 ， 那 么 可 
以 用 HEAD {RÆ GET。 最 后 ， 用 / ~ banana/ 代替 / ~ ross/ ， 看 看 你 得 到 什么 类 型 的 啊 应 报 文 。 

在 本 市 中 ， 我 们 讨论 了 HTTP 请 求 报 文 和 响应 报 文中 的 一 些 首部 行 。HTTP 规范 中 定 
义 了 很 多 可 以 被 浏览 器 、Web 服务 器 和 Web 缓存 服务 器 插 人 的 首部 行 。 我 们 只 提 到 了 全 
部 首部 行 中 的 少数 几 个 , 在 2.2.5 市 中 我 们 讨论 网 络 Web 缓存 时 还 会 涉及 其 他 几 个 ,一 本 
可 读 性 很 强 的 文献 是 【Krishnamurty 2001] ， 它 对 HTTP 协议 (包括 它 的 首部 行 和 状态 倘 ) 
进行 了 广泛 讨论 。 

浏览 硕 是 如 何 决定 在 一 个 请 求 报 文中 包含 哪些 首部 行 的 呢 7 Web 服务 天 又 是 如 何 决定 
在 一 个 啊 应 报 文 中 包含 哪些 首部 行 呢 ? 浏览 需 产 生 的 首部 行 与 很 多 因素 有 天 ， 包 括 浏 览 硕 
的 类 型 和 协议 版 本 (例如 ，HTTPZ1.0 浏览 器 将 不 会 产生 任何 1.1 版 本 的 首部 行 ) 、 浏 览 器 
的 用 户 配 置 (如 喜好 的 语言 ) 、 浏 览 器 当前 是 否 有 一 个 绥 存 的 但 是 可 能 超期 的 对 象 版 本 。 
Web 服务 硕 的 表现 也 类 似 : 在 产品 、 版 本 和 配置 上 都 有 差异 ， 所 有 这 些 都 会 影响 啊 应 报 文 
中 包含 的 首部 行 。 


2.2.4 用 户 与 服务 器 的 交互 : cookie 


我 们 前 面 提 到 了 HTTP 服务 需 是 无 状态 的 。 这 简化 了 服务 需 的 设计 ， 并 且 爷 许 工程 师 
们 去 开发 可 以 同时 处 理 数 以 千 计 的 TCP 连接 的 高 性 能 Web 服务 器 。 然 而 一 个 Web 站 点 通 
常 希望 能 够 识别 用 户 ， 可 能 是 因为 服务 带 希 望 限 制 用 户 的 访问 ， 或 者 因为 它 希 望 把 内 容 与 
用 户 身 份 联系 起 来 。 为 此 ，HTTP 使 用 了 cookie, cookie 在 [RFC 6265] 中 定义 , 它 允许 
站 点 对 用 户 进行 跟踪 。 目 前 大 多 数 商 务 Web 站 点 都 使 用 了 cookie, 

如 图 2-10 Aras, cookie 技术 有 4 个 组 件 : GCE HTTP 啊 应 报 文中 的 一 个 cookie 首部 
ÍT; DE HTTP 请 求 报 文中 的 一 个 cookie 首部 行 ; @@ 在 用 户 端 系统 中 保留 有 一 个 cookie X 
件 ， 并 由 用 户 的 浏览 器 进行 管理 ;由 位 于 Web 站 点 的 一 个 后 端 数 据 库 。 使 用 图 2-10， 我 
们 通过 一 个 典型 的 例子 看 看 cookie 的 工作 过 程 。 假 设 Susan 总 是 从 家 中 PC 使 用 Internet 
Explorer 上 网 ， 她 首次 与 Amazon. com 联系 。 我 们 假定 过 去 她 已 经 访问 过 eBay 站 点 。 当 请 
求 报 文 到 达 该 Amazon Web 服务 器 时 ， 该 Web 站 点 将 产生 一 个 唯一 识别 码 ， 并 以 此 作为 索 
引 在 它 的 后 端 数据 库 中 产生 一 个 表 项 。 接 下 来 Amazon Web 服务 船用 一 个 包含 Set-cookie: 
首部 的 HTTP 响应 报 文 对 Susan 的 浏览 器 进行 响应 ， 其 中 Set-cookie: 首部 含有 该 识别 但 . 
例如 ， 该 首部 行 可 能 是 


Set-cookie: 1678 
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客户 主机 服务 器 主机 







:一 服务 器 为 用 户 
创建 ID 1678 





访问 ae 


一 星期 后 -| : - 

> AHT : 访问 
crs > "ATE TP J 
g: okie: a : 


amazon: 1678 ! 


amazon: 1678 : 
ebay: 8734 





ebay: 8734 ;一 一 cookie 特 定 
: 动作 
， : 
时 间 时 间 
图 例 : 


cookic 文 件 
图 2-10 ”用 cookie 跟踪 用 户 状 态 


当 Susan 的 浏览 器 收 到 了 该 HTTP 啊 应 报 文 时 ， 它 会 看 到 该 Set-cookie: APA. KM 
i tr CEE B FL FFE cookie 文件 中 添加 一 行 ， 该 行 包含 服务 带 的 主机 名 和 在 Set-cookie: 
首部 中 的 识别 码 。 值 得 注意 的 是 该 cookie 文件 已 经 有 了 用 于 eBay 的 表 项 ， 因 为 Susan 过 
去 访问 过 该 站 点 。 当 Susan 继续 浏览 Amazon 网 站 时 ， 每 请 求 一 个 Web mihi, FER UE at 
就 会 从 该 cookie 文件 中 获取 她 对 这 个 网 站 的 识别 码 ， 并 放 到 HTTP 请 求 报 文中 包括 识别 
码 的 cookie 首部 行 中 。 特 别 是 ， 发 往 该 Amazon 服务 需 的 每 个 HTTP 请 求 报 文 都 包括 以 
下 首部 行 : 

Cookie: 1678 

在 这 种 方式 下 ，Amazon AR% gen WARE Susan 在 Amazon 站 点 的 活动 . 尽管 Amazon 
Web 站 点 不 必 知 道 Susan 的 名 字 ， 但 它 确 切 地 知道 用 户 1678 FHA ZU. ETE ETA] 
访问 了 哪些 页 面 ! Amazon 使 用 cookie 来 提供 它 的 购物 车 服务 ， 即 Amazon 能 够 维护 Susan 
希望 购买 的 物品 列表 ， 这 样 在 Susan 结束 会 话 时 可 以 一 起 为 它们 付费 。 

如 果 Susan 再 次 访问 Amazon 站 上 点， 比如 说 一 个 星期 后 ， 她 的 浏览 融会 在 其 请 求 报 文 
中 继续 放 入 首部 行 cookie: 1678, Amazon 将 根据 Susan 过 去 在 Amazon 访问 的 网 页 向 她 推 
荐 产品 。 如 果 Susan 也 在 Amazon 注册 过 ， 即 提供 了 她 的 全 名 、 电 子 邮 件 地 址 、 邮 政 地 址 
和 信用 卡 账 号 ， 则 Amazon 能 在 其 数据 库 中 包括 这 些 信 息 ， 将 她 的 全 名 与 识别 码 相 关联 
(以 及 她 在 过 去 访问 过 的 所 有 页 面 )。 这 就 解释 了 Amazon 和 其 他 一 些 电 子 商 务 网 站 实现 
“点 击 购物 ”(one-click shopping) 的 道理 ， 即 当 Susan 在 后 继 的 访问 中 选择 购 头 某 个 物品 
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时 ， 她 不 必 重 新 输入 姓名 、 信 用 卡 账 号 或 者 地 址 等 信息 了 。 

从 上 述 讨论 中 我 们 看 到 ，cookie 可 以 用 于 标识 一 个 用 户 。 用 户 首次 访问 一 个 站 点 时 ， 
可 能 需要 提供 一 个 用 户 标 识 Ca BAEK SE). FEI ARTA, DOE a ed AR he A 
cookie 首部 ， 从 而 向 该 服务 器 标识 了 用 户 。 因 此 cookie 可 以 在 无 状态 的 HTTP 之 上 建立 一 
个 用 户 会 话 层 。 例 如 ， 当 用 户 向 一 个 基于 Web 的 电子 邮件 系统 (如 Hotmail) 注册 时 ， 浏 
览 硕 回 服务 需 发 送 cookie 信息 ， 人 允许 该 服务 融 在 用 户 与 应 用 程序 会 话 的 过 程 中 标识 该 
用 户 。 

尽管 cookie 常常 能 简化 用 户 的 因特网 购物 活动 ， 但 是 它 的 使 用 仍 具 有 和 争议， 因为 它们 
被 认为 是 对 用 户 隐 私 的 一 种 侵害 。 如 我 们 刚才 所 见 ， 结 舍 cookie 和 用 户 提 供 的 账户 信息 ， 
Web 站 点 可 以 知道 许多 有 关 用 户 的 信息 ， 并 可 能 将 这 些 信 息 卖 给 第 三 方 。Cookie Central 
| Cookie Central 2012] 包括 了 对 cookie 争论 的 广泛 信息 。 


2.2.5 Web 缓存 


Web 缓存 器 (Web cache) 也 叫 代 
理 服务 器 (proxy server) ， 它 是 能 够 代表 
初始 Web Whe AKW AL HTTP 请 求 的 网 
络 实体 ，Web 缓存 项 有 目 己 的 磁盘 存储 
空间 ， 并 在 存储 空间 中 保存 最 近 请 求 过 
的 对 象 的 副本 。 如 图 2-11 所 示 ， 可 以 配 
置 用 户 的 浏览 右 ， 使 得 用 户 的 所 有 HTTP 
请 求 首 先 指 回 Web fF ar. — ASEM KE 
fir OX AL ET, BES RT ET Be BY DO OE at Teg OR 
首先 被 定 同 到 该 Web BF at. AE PK 
说 , (Be i Di) Ok ais TE FE tap OK XT R http; // 
www. someschool. edu/campus. gf， 将 会 发 

。 浏览 器 建立 一 个 到 Web 缓存 器 的 TCP 连接 ， 并 向 Web 缓存 带 中 的 对 象 发 送 一 个 
HTTP 请 求 。 

。 Web 缓存 器 进 行 检 查 ， 看 看 本 地 是 否 存储 了 该 对 象 副 本 。 如 果 有 ，Web RI Ari 
向 客户 浏览 器 用 HTTP 响应 报 文 返回 该 对 象 。 

o 如 果 Web 缓存 器 中 没有 该 对 象 ， 它 就 打开 一 个 与 该 对 象 的 初始 服务 天 (如 
www. someschool. edu) 的 TCP 连接 。Web 缓存 器 则 在 这 个 缓存 句 到 服务 库 的 TCP 
连接 上 发 送 一 个 对 该 对 象 的 HTTP 请 求 。 在 收 到 该 请 求 后 ， 初 始 服务 硕 回 该 Web 
缓存 器 发 送 具 有 该 对 象 的 HTTP 响应 。 

o 当 Web 绥 存 器 接收 到 该 对 象 时 ， 它 在 本 地 存储 空间 存储 一 份 副本 ， 并 向 客户 的 浏 
览 器 用 HTTP 响应 报 文 发 送 该 副本 (通过 现 有 的 客户 浏览 器 和 Web 缓存 器 之 间 的 
TCP 连接 ) 。 

值得 注意 的 是 Web 缓存 器 是 服务 器 同时 又 是 客户 。 当 它 接收 浏览 器 的 请 求 并 发 回 啊 

应 时 ， 它 是 一 个 服务 器 。 当 它 向 初始 服务 需 发 出 请 求 并 接收 啊 应 时 ， 它 是 一 个 客户 -。 
Web 缓存 器 通常 由 ISP 购买 并 安装 。 例 如 ， 一 所 大 学 可 能 在 它 的 校园 网 上 安装 一 台 绥 
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图 2-11 客户 通过 Web 缓存 需 请 求 对 象 
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存 器 ， 并 且 将 所 有 校园 网 上 的 用 户 浏览 器 配置 为 指向 它 。 或 者 ， 一 个 主要 的 住宅 ISP ( 例 
如 AOL) 可 能 在 它 的 网 络 上 安装 一 台 或 多 台 Web 缓存 器 ， 并 且 预 先 配置 其 配套 的 浏览 器 
指 问 这 些 缓存 带 。 

在 因特网 上 部 署 Web 缓存 器 有 两 个 原因 。 首 先 ，Web 缓存 器 可 以 大 大 减少 对 客户 请 
求 的 响应 时 间 ， 特 别 是 当 客 户 与 初始 服务 器 之 间 的 瓶颈 带宽 远 低 于 客户 与 Web 缓存 大 之 
间 的 瓶 颂 带 宽 时 更 是 如 此 。 如 果 在 客户 与 Web 缓存 器 之 间 有 一 个 高 速 连 接 (情况 第 第 如 
此 )， 并 且 如 果 用 户 所 请 求 的 对 象 在 Web 缓存 器 上 ， 则 Web 缓存 器 可 以 迅速 将 该 对 象 交付 
给 用 户 。 其 次 ， 如 我 们 马上 用 例子 说 明 的 那样 ，Web 缓存 希 能 够 大 大 减少 一 个 机 构 的 接 和 人 
链 路 到 因特网 的 通信 量 。 通 过 减少 通信 量 ， 该 机 构 (如 一 家 公司 或 者 一 所 大 学 ) 就 不 必 急 
于 增加 带宽 ， 因 此 降低 了 费用 。 此 外 ，Web 缓存 器 能 从 整体 上 大 大 减低 因特网 上 的 Web 
流量 ， 从 而 改善 了 所 有 应 用 的 性 能 。 

为 了 深入 理解 缓存 器 带 来 的 好 处 ， 我 们 考虑 在 
图 2-12 场景 下 的 一 个 例子 。 该 图 显示 了 两 个 网 络 ， ga 
即 机 构 (内 部 ) 网 络 和 公共 因特网 的 一 部 分 。 机 
构 网 络 是 一 个 高 速 的 局 域 网 ， 它 的 一 台 路 由 带 与 因 
特 网 上 的 一 台 路 由 上 需 通 过 一 条 15Mbps 的 链 路 连 
接 。 这 些 初 始 服务 器 与 因特网 相连 但 位 于 全 世界 各 
地 。 假 设 对 象 的 平均 长 度 为 1Mb， 从 机 构 内 的 浏览 
能 对 这 些 初始 服务 占 的 平均 访问 速率 为 每 秒 15 个 
请 求 。 假 设 HTTP 请 求 报 文 小 到 可 以 忽略 ， 因 而 不 
会 在 网 络 中 以 及 接 入 链 路 〈 从 机 构 内 部 路 由 天 到 
因特网 路 由 器 ) 上 产生 什么 通信 量 。 我 们 还 假设 
在 图 2-12 中 从 因特网 接 人 链 路 一 侧 的 路 由 需 转 发 
HTTP 请 求 报 文 (在 一 个 IP 数据 报 中 ) 开始 ， 到 
它 收 到 其 响应 报 文 (通常 在 多 个 IP 数据 报 中 ) 为 
止 的 时 间 平 均 为 2 秒 。 我 们 非 正 式 地 将 该 持续 时 延 
称 为 “因特网 时 延 ”。 

总 的 响应 时 间 ， 即 从 浏览 器 请 求 一 个 对 象 到 接 
收 到 该 对 象 为 止 的 时 间 ， 是 局 域 网 时 延 、 接 入 时 延 
( 即 两 台 路 由 器 之 间 的 时 延 ) 和 因特网 时 延 之 和 。 我 们 来 粗略 地 估算 一 下 这 个 时 延 。 局 域 
网 上 的 流量 强度 (参见 1.4.2 市 ) 为 

(15 个 请 求 /s) x (1Mbv 请 求 )/(100Mbps) = 0.15 
然而 接 入 链 路 上 的 流量 强度 (从 因特网 路 由 天 到 机 构 路 由 硕 ) 为 
(15 个 请 求 /s) x (1Mb/ if R )/(15Mbps) = 1 

局 域 网 上 强度 为 0. 15 的 通信 量 最 多 导致 数 十 毫秒 的 时 延 ， 因 此 我 们 可 以 忽略 局 域 网 
时 延 。 然 而 ， 如 在 1.4.2 节 讨 论 的 那样 ， 如 果 流 量 强度 接近 1 (就 像 在 图 2-12 中 接 人 链 路 
的 情况 那样 ) ， 链 路 上 的 时 延 会 变 得 非常 大 并 且 无 限 增长 。 因 此 ， 满 足 请 求 的 平均 啊 应 时 
间 将 在 分 钟 的 量 级 上 。 显 然 ， 必 须 想 办 法 来 改进 时 间 啊 应 特性 。 

一 个 可 能 的 解决 办 法 就 是 增加 接 入 链 路 的 速率 ， 如 从 1S Mbps 增加 到 100Mbps。 这 可 
以 将 接 入 链 路 上 的 流量 强度 减少 到 0. 15 ， 这 样 一 来 ， 两 台 路 由 希 之 间 的 链 路 时 延 也 可 以 名 











。 机 构 网 络 


图 2-12 ”一 个 机 构 网 络 与 内 特 网 之 间 的 瓶 贷 
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略 了 。 这 时 ， 总 的 啊 应 时 间 将 大 约 为 2 秒 钟 ， 即 为 因特网 时 延 。 但 这 种 解决 方案 也 意味 看 
该 机 构 必 须 将 它 的 接 入 链 路 由 15Mbps 升级 为 100Mbps， 这 是 一 种 代价 很 高 的 方案 。 

现在 来 考虑 男 一 种 解决 方案 ， 即 不 升级 链 路 带宽 而 是 在 机 构 网 络 中 安 痰 一 个 Web 组 
存 融 。 这 种 解决 方案 如 网 2-13 所 示 。 实 践 中 的 命中 率 ( 即 由 一 个 缓存 带 所 满足 的 请 求 的 
比率 ) 通常 在 0.2 ~0.7 之 间 。 为 了 便于 阐述 ， 我 们 假设 该 机 构 的 缓存 命中 率 为 0.4。 因为 
客户 和 缓存 连接 在 一 个 相同 的 高 速 局 域 网 上 ， 这 样 40% 的 请 求 将 几乎 立即 会 由 缓 企 外 得 到 
响应 ， 时 延 约 在 10ms 以 内 。 然 而 ， 剩 下 的 60% 的 请 求 仍然 要 由 初始 服务 器 来 满足 但 是 
只 有 60% 的 被 请 求 对 象 通过 接 人 链 路 ， 在 接 人 链 路 上 的 流量 强度 从 1.0 减 小 到 0.6, 一般 
而 言 ， 在 15Mbps 链 路 上 ， 当 流量 强度 小 于 0.8 时 对 应 的 时 延 较 小 ， 约 为 几 十 坚 秒 。 这 个 
时 延 与 2 秒 因特网 时 延 相 比 是 微不足道 的 。 考 虑 这 些 之 后 ， 平 均 时 延 因此 为 

0.4 x (0.010 秒 ) +0.6 x (2.01 秒 ) 

这 略 大 于 1.2 秒 。 因此， 第 二 种 解决 方 初始 服务 器 
案 提 供 的 响应 时 延 甚至 比 第 一 种 解决 方案 
更 低 ， 也 不 需要 该 机 构 升 级 它 到 因特网 的 
链 路 。 该 机 构 理 所 当然 地 要 购买 和 安 珍 
Web 缓存 器 。 除 此 之 外 其 成 本 较 低 ， 很 多 
缓存 俘 使 用 了 运行 在 廉价 PC 上 的 公共 域 
软件 。 

通过 使 用 内 容 分 发 网 络 (Content Distri- 
bution Network, CDN), Web 2¢4¢ #8 iF E [Al 
特 网 中 发 挥 着 越 来 越 重 要 的 作用 。CDN 公 
司 在 因特网 上 安装 了 许多 地 理 上 分 散 的 组 
存 硕 ， 因 而 使 大 量 流量 实现 了 本 地 化 。 有 
多 个 共享 的 CDN (例如 Akamai 和 Lime- 
light) 和 专用 的 CDN 〈 例 如 谷歌 和 微软 ) 。 
我 们 将 在 第 7 草 中 更 为 详细 地 讨论 CDN, 


2.2.6 条件 包 ET 方法 


尽管 高 速 缓存 能 减少 用 户 感受 到 的 啊 
应 时 间 , 但 也 引入 了 一 个 新 的 问题 ， 即 存 图 2-13 ”为 机 构 网 络 添 加 一 台 缓 存 器 
放 在 绥 存 器 中 的 对 象 副 本 可 能 是 陈旧 的 。 
换 名 话说， 保存 在 服务 器 中 的 对 象 自 该 副本 缓存 在 客户 上 以 后 可 能 已 经 被 修改 了 。 和 幸运 
HÆ, HTTP 协议 有 一 种 机 制 ， 允 许 缓 存 右 证 实 它 的 对 象 是 最 新 的 。 这 种 机 制 就 是 条 件 
GET (conditional GET) 方法 。 如 果 : 中 请 求 报 文 使 用 GET 方法 ; 并 且 凶 请 求 报 文 中 包 
含 一 个 “If- Modified-Since:” 首 部 行 。 那 么 ， 这 个 HTTP 请 求 报 文 就 是 一 个 条 件 CET 请 
求 报 文 。 

为 了 说 明 GET 方法 的 操作 方式 ,我们 看 一 个 例子 。 首 先 ， 一 个 代理 缓存 器 (proxy 
cache) 代表 一 个 请 求 浏览 器 ， 回 某 Web 服务 器 发 送 一 个 请 求 报 文 : 


GET /fruit/kiwi.gif HTTP/1.1 
Host: www.exotiquecuisine.com 
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其 次 ， 该 Web IR % Ar le] FF AR RA HA RR AY AT R AI IZ FR SL : 
HTTP/1.1 200 OK 

Date: Sat, 8 Oct 2011 15:39:29 

Server: Apache/1.3.0 (Unix) 

Last-Modified: Wed, 7 Sep 2011 09:23:24 

Content-Type: image/gif 


(data data data data data ...) 


ARIT TERR ARG Ae BTR A E AAAF, BERR TARR. RINE, 


EIT a TETT IAM Ba th M T n EAH WH, B=, PE, AWAK 
FEADR — NRR, ARREA NERT REP. H e Ph 位 于 Web 服 
nn i 至 被 修改 了， 该 缓存 靛 通过 发 送 一 个 条 件 GET 执行 最 新 检查 。 具 


GET hapas HTTP/1.1 
Host: www.exotiquecuisine.com 
If-Modified-Since: Wed, 7 Sep 2011 09:23:24 


值得 注意 的 是 If- Modified-Since: 首部 行 的 值 正 好 等 于 一 星期 前 服务 需 发 送 的 啊 应 报 文 
中 的 Last- Modified: 首部 行 的 值 。 its GET RALES ak, M4 ASE AZ AKT 
象 被 修改 过 ， 才 发 送 该 对 象 。 假 设 该 对 象 自 2011 年 9 月 7 日 09: 23; 24 后 没有 被 修改 ， 
接 下 来 的 第 四 步 ，Web 服务 器 向 该 缓存 器 发 送 一 个 啊 应 报 文 : 


HTTP/1.1 304 Not Modified 
Date: Sat, 15 Oct 2011 15:39:29 
Server: Apache/1.3.0 (Unix) 


(empty entity body) 

我 们 看 到 ， 作 为 对 该 条 件 CET 方法 的 响应 ， 该 Web 服务 器 仍 发 送 一 个 啊 应 报 文 ， 但 
并 没有 在 该 啊 应 报 文中 包含 所 请 求 的 对 象 。 包含 该 对 象 只 会 浪费 带宽 ， 并 增加 用 户 感 受到 
的 啊 应 时 间 ， 特 别 是 如 果 该 对 象 很 大 的 时 候 更 是 如 此 。 值 得 注意 的 是 在 最 后 的 啊 应 报 文 
中 ， 状 态 行 中 为 304 Not Modified， 它 告诉 缓存 紫 可 以 使 用 该 对 象 ， 能 向 请 求 的 浏览 絮 转 发 
它 ( 该 代理 缓存 器 ) 缓存 的 该 对 象 副本 。 

我 们 现在 完成 了 对 HTTP 的 讨论 ， 这 是 我 们 详细 学 习 的 第 一 个 因特网 协议 (应 用 层 协 
尺 ) 。 我 们 已 经 学 习 了 HTTP 报 文 的 格式 ， 学 习 了 当 发 送 和 接收 这 些 报 文 时 Web 客户 和 服 
务 器 所 采取 的 动作 。 我 们 还 学 习 了 一 点 Web 应 用 程序 基础 设施 ， 包 括 缓 存 、cookie 和 后 端 
数据 库 ， 所 有 这 些 都 以 某 种 方式 与 HTTP 协议 有 关 。 


2.3 文件 传输 协议 : FTP 


在 一 个 典型 的 FTP 会 话 中 ， 用 户 坐 在 一 台 主 机 (本 地 主机 ) 前 面 ， 回 一 台 远 程 主 机 
传输 (或 接收 来 自 远 程 主机 的 ) 文件 。 为 使 用 户 能 访问 它 的 远程 账户 ， 用 户 必 须 提供 一 个 
用 户 标 识 和 口令 。 在 提供 了 这 种 授权 信息 后 ， 用 户 就 能 从 本 地 文件 系统 向 远程 主机 文件 系 
统 传送 文件 ， 反 之 亦 然 。 如 图 2-14 所 示 ， 用 户 通 过 一 个 FTP 用 户 代 理 与 FTP 交互 。 该 用 
户 首先 提供 远程 主机 的 主机 名 ,使 本 地 主机 的 FTP 客户 进程 建立 一 个 到 远程 主机 FTP 服务 
frit ely TCP 连接 。 该 用 户 接 着 提供 用 户 标识 和 口令 ， 作 为 PIP 命令 的 一 部 分 在 该 TCP 
连接 上 传送 。 一 旦 该 服务 器 向 该 用 户 授 权 ， 用 户 可 以 将 存放 在 本 地 文件 系统 中 的 一 个 或 者 
多 个 文件 复制 到 远程 文件 系统 (反之 亦 然 )。 
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本 地 文件 系统 远程 文件 系统 
图 2-14 使 用 FTP 协议 在 本 地 和 远程 文件 系统 之 间 移 动 文件 


HTTP 和 FTP 都 是 文件 传输 协议 ， 并 且 有 很 多 共同 的 特点 ， 人 例如， 它们 都 运行 在 TCP 
上 。 然 而 ， 这 两 个 应 用 层 协议 也 有 一 些 重要 的 区 别 。 其 中 最 显著 的 就 是 FTP 使 用 了 两 个 并 
行 的 TCP 连接 来 传输 文件 ， 一 个 是 控制 连接 (control connection) ， 一 个 是 数据 连接 (data 
connection ) 。 ERER TENEN IB) aan el fra, AV 口令 、 改 变 远程 目 
录 的 命令 以 及 “存放 (put) ”和 “获取 (geb) ”文件 的 命令 。 数据 连接 用 于 实际 发 送 一 个 
文件 。 因 为 FTP 协议 使 用 一 个 独立 的 控制 连接 ， 所 以 我 们 也 称 FTP 的 控制 信息 是 市 外 
(out-of-band) 传送 的 。 如 你 所 知 ，HTTP 协议 是 在 传输 文件 的 同一 Re 
和 响应 首部 行 的 。 因 此 ，HTTP 也 可 以 说 是 带 内 (in-band) 发 送 控制 信息 FTP 协议 的 
控制 连接 和 数据 连接 如 图 2-15 所 示 。 





ee jones TCP 控 制 连接 端口 21 
当 用 户主 机 与 远程 主机 开始 一 个 FTP 会 ax 
话 时 ，FTP 的 客户 (用户) imt IENRIS Air TCP 数 据 连 接 端口 20 yE 





21 SO GAR AR (远程 主机 ) thin AC — A 
用 于 控制 的 TCP 连接 。FTP AIA FA fiith t 
该 控制 连接 发 送 用 户 的 标识 和 口令 ， 发 送 改 
变 远 程 目录 的 信 令 。 当 FTP 的 服务 带 端 从 该 连接 上 收 到 一 个 文件 传输 的 命令 后 〈 无 论 是 回 
还 是 来 自 远程 主机 ) ， 就 发 起 一 个 到 客户 端的 TCP 数据 连接 。FTP 在 该 数据 连接 上 准确 地 
传送 一 个 文件 ， 然 后 关闭 该 连接 。 在 同一 个 会 话 期 间 ， 如 果 用 户 还 需要 传输 男 一 个 文件 ， 
FTP 则 打开 另 一 个 数据 连接 。 因 而 对 FTP 传输 而 言 ， 控 制 连接 贯穿 了 整个 用 户 会 话 期 间 ， 
但 是 对 会 话 中 的 每 一 次 文件 传输 都 需要 建立 一 个 新 的 数据 连接 〈 即 数据 连接 是 非 持 续 的 ) 。 
FTP 服务 器 必须 在 整个 会 话 期 间 保 留用 户 的 状态 (state) 。 特 别 是 ， 服 务 器 必须 把 特 
定 的 用 户 账户 与 控制 连接 联系 起 来 ， 随 着 用 户 在 远程 目录 树 上 徘徊 ， 服 务 融 必须 追踪 用 户 
在 远程 日 录 树 上 的 当前 位 置 。 对 每 个 进行 中 的 用 户 会 话 的 状态 信息 进行 追踪 ， 大 大 限制 了 
FTP 同时 维持 的 会 话 总 数 。 而 男 一 方面 ， 前 面 讲 过 HTTP 是 无 状态 的 ， 即 它 不 必 对 任何 用 
户 状态 进行 追 踩 。 


FTP 命令 和 回答 


FTP 服 务 器 
图 2-15 控制 连接 和 数据 连接 


我 们 通过 简要 地 讨论 几 个 常见 的 FTP 命令 和 回答 来 结束 本 节 。 从 客户 到 服务 硕 的 命令 
和 从 服务 器 到 客户 的 回答 ， 都 是 以 7 比特 ASCH 格式 在 控制 连接 上 传送 的 。 因此， 与 
HTTP 协议 的 命令 类 似 ，FTP 协议 的 命令 也 是 人 可 读 的 。 为 了 区 分 连续 的 命令 ， 每 个 命令 
后 跟 回 车 换行 符 。 每 个 命令 由 4 个 大 写字 母 ASCI 字符 组 成 ， 有 些 还 具有 可 选 参数 。 一 


BEA FS ULA ATS a : 
e USER username; 用 于 向 服务 需 传 送 用 户 标识 。 
e PASS password; 用 于 回 服 务 磊 发 送 用 户口 令 。 
。 LIST: 用 于 请 求 服务 器 回 送 当前 远程 目录 中 的 所 有 文件 列表 。 该 文件 列表 是 经 一 
个 〈 新 建 且 非 持 续 连 接 ) 数据 连接 传送 的 ， 而 不 是 在 控制 TCP 连接 上 传送 。 
e RETR filename; 用 于 从 远程 主机 当前 目录 检索 (Bll get) 文件 。 该 命令 引起 远程 主 
机 发 起 一 个 数据 连接 ， 并 经 该 数据 连接 发 送 所 请 求 的 文件 。 
e STOR filename: 用 于 在 远程 主机 的 当前 目录 上 存放 (BI put) 文件 。 
贯穿 控制 连接 ， 在 用 户 发 出 的 命令 和 FTP 发 送 的 命令 之 间 通 常 有 一 一 对 应 关系 。 每 个 
合 令 都 对 应 着 一 个 从 服务 顺 发 回 客 户 的 回答 。 回 答 是 一 个 3 位 的 数字 ， 后 跟 一 个 可 选 信 
息 ， 这 与 HTTP 响应 报 文 状态 行 的 状态 码 和 状态 信息 的 结构 相同 。 一些 典型 的 回答 连同 它 
们 可 能 的 报 文 如 下 所 示 : 
e 331 Username OK, Password required (用 户 名 OK, 需要 a+). 
e 125 Data connection already open; transfer starting ( 数据 连接 已 经 打开 ， 开 始 传送 - 
èe 425 Can’ t open data connection (无 法 打开 数据 连接 ) 。 
e 452 Error writing file ( 写 文 件 差 错 ) 。 
有 兴趣 学 习 其 他 FTP 命令 和 回答 的 读者 请 阅读 RFC 959, 


2.4 ”因特网 中 的 电子 邮件 


晶 从 有 了 了 因特网， 电子 邮件 就 在 因特网 上 流行 起 来 。 本 电子 邮 
件 已 经 成 为 最 为 流行 的 应 用 程序 | Segaller 1998] ， 年 复 一 年 ， 它 变 得 越 来 越 精 细 ， 越 来 越 
哩 大 。 它 是 当今 因特网 上 最 重要 和 实用 的 应 用 程序 之 一 。 

与 普通 邮件 一 样 ， 电 子 邮 件 是 一 种 异步 通信 媒介 ， 即 当 人 们 方便 时 就 可 以 收发 邮件 ， 
不 必 与 他 人 的 计划 进行 协调 。 与 普通 邮件 相 比 ， 电 子 邮 件 更 为 快速 并 且 易 于 分 发 ， 而 且 价 
格 便宜 。 现 代 电子 邮件 具有 许多 强大 的 特性 ， 包 括 具有 附件 、 超 链接 、HTML 格式 文本 和 
图 片 的 报 文 。 





Web 电子 邮件 


1995 年 12 月 ,在 Web“ 发 明 ” 后 仅 过 了 几 年 ，Sabeer Bhatia 和 Jack Smith 拜访 了 
因特网 风险 投资 人 Draper Fisher Jurvetson ， 提 出 了 研发 一 个 免费 的 基于 Web 的 电子 邮件 
系统 的 建议 。 其 基本 想法 是 为 任何 想 要 的 人 分 配 一 个 免费 的 电子 邮件 账户 ， 并 且 使 得 这 
个 账户 可 以 在 Web 上 使 用 。 通 过 用 公司 的 15% 份 额 作 为 交换 ，Draper Fisher Jurvetson 向 
Bhatia 和 Smith 提供 了 资金 ， 后 者 组 建 了 一 家 公司 ， 叫 做 Hotmail。3 个 全 职员 工 和 14 个 
兼职 人 员 为 了 自己 拥有 的 股份 而 工作 ，1996 年 7 月 ， 他 们 研发 并 提供 了 该 服务 。 之 后 的 

一 个 月 内 ， 他 们 就 拥有 了 100000 名 用 户 。1997 年 12 月 ， 在 启动 该 服务 不 到 18 个 月 内 ， 
Hotmail 就 拥有 超过 1200 万 个 用 户 ， 并 且 以 4 亿美 元 的 价格 被 微软 公司 收购 。Hotmail 公 
司 的 成 功 常 被 归结 于 它 的 “先行 者 优势 (first-mover advantage) ”和 它 国 有 的 电子 邮件 
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“病毒 行销 (viral marketing) ”策略 。( 也 许 正在 阅读 本 书 的 菜 些 学 生 将 会 成 为 这 种 新 人 
之 一 一 一 构思 并 开发 具有 “先行 者 优势 ”和 “病毒 行销 ”策略 特征 的 因特网 服务 .) 

Web 电子 邮件 继续 兴盛 ， 每 年 都 变 得 更 为 复杂 和 功能 强大 。 当今 最 为 流行 的 服务 之 
一 是 谷歌 的 Gmail， 它 提供 了 千 兆 字 节 的 免费 存储 、 先 进 的 垃圾 邮件 过 滤 和 病毒 检测 、 
电子 邮件 加 密 (使 用 SSL) 、 对 第 三 方 电子 邮件 服务 的 邮件 接纳 和 面向 搜索 的 界面 .和 社 
交 网 络 如 脸谱 中 的 异步 信息 转发 在 近年 来 也 已 经 变 得 流行 。 


在 本 节 中 ， 我 们 将 讨论 位 于 因特网 电子 邮件 的 核心 地 位 的 应 用 层 协议 。 在 深入 讨论 这 
些 应 用 层 协 议 之 前 ,我 们 先 总 体 上 看 看 因特网 电子 邮件 系统 和 它 的 关键 组 件 . 

图 2-16 给 出 了 因特网 电子 邮件 系统 的 总 体 情况 。 从 该 图 中 我 们 可 以 看 到 它 有 3 个 主 
要 组 成 部 分 : AARI (user agent), AFARS ES (mail server) 和 简单 邮件 传输 协议 
(Simple Mail Transfer Protocol，SMTP ) 。 下 面 我 们 结合 发 送 方 Alice 发 电子 邮件 给 接收 方 
Bob 的 例子 ， 对 每 个 组 成 部 分 进行 描述 。 用 户 代 理 允 许 用 户 阅 读 、 回 复 、 转 发 、 保 存 和 扬 
写 报 文 。 微 软 的 Outlook 和 Apple Mail 是 电子 邮件 用 户 代理 的 例子 。 当 Alice 完成 邮件 撰 与 
时 ， 她 的 邮件 代理 回 其 邮件 服务 器 发 送 邮 件 ， 此 时 邮件 放 在 邮件 服务 釉 的 外 出 报 文 队 
列 中 。 





图 例 : 
[SS 外 出 报 文 队列 。 图 用 户 邮箱 


图 2-16 因特网 电子 邮件 系统 的 总 体 描述 


邮件 服务 器 形成 了 电子 邮件 体系 结构 的 核心 。 每 个 接收 方 (如 Bob) 在 其 中 的 采 个 邮 
件 服务 器 上 有 一 个 邮箱 (mailbox), Bob 的 邮箱 管理 和 维护 着 发 送 给 他 的 报 文 。 一 个 典型 
的 邮件 发 送 过 程 是 : 从 发 送 方 的 用 户 代理 开始 ， 传 输 到 发 送 方 的 邮件 服务 器 ， 再 传输 到 接 
收 方 的 邮件 服务 器 ， 然 后 在 这 里 被 分 发 到 接收 方 的 邮箱 中 。 当 Bob 要 在 他 的 邮箱 中 读 取 该 
报 文 时 ,包含 他 邮箱 的 邮件 服务 器 (使 用 用 户 名 和 口令 ) 来 鉴别 Bob, Alice 的 邮箱 也 必 
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须 能 处 理 Bob 的 邮件 服务 器 的 故障 。 如果 Alice 的 服务 器 不 能 将 邮件 交付 给 Bob 的 服务 器 ， 
Alice 的 邮件 服务 闫 在 一 个 报 文 队 列 (message queue) 中 保持 该 报 文 并 在 以 后 和 尝试 再 次 发 
送 。 通常 每 30 分 钟 左右 进行 一 次 尝试 ; 如 果 几 天 后 仍 不 能 成 功 ， 服 务 器 就 删除 该 报 文 并 
以 电子 邮件 的 形式 通知 发 送 方 (Alice), 

SMTP 是 因特网 电子 邮件 中 主要 的 应 用 层 协议 。 它 使 用 TCP 可 靠 数 据 传输 服务 ， 从 发 
送 方 的 邮件 服务 需 回 接收 方 的 邮件 服务 器 发 送 邮 件 。 像 大 多 数 应 用 层 协议 一 样 ，SMTP 也 
有 两 个 部 分 : 运行 在 发 送 方 邮 件 服 务 需 的 客户 端 和 运行 在 接收 方 邮件 服务 需 的 服务 需 端 。 
每 台 邮 件 服 务 希 上 既 运 行 SMTP 的 客户 端 也 运行 SMTP 的 服务 需 端 。 当 一 个 邮件 服务 需 癌 
其 他 邮件 服务 器 发 送 邮 件 时 ， 它 就 表现 为 SMTP 的 客户 ， 当 邮件 服务 器 从 其 他 邮件 服务 器 
上 接收 邮件 时 ， 它 就 表现 为 一 个 SMTP AY He HF AN - 


2.4.1 SMTP 


RFC 5321 给 出 了 SMTP 的 定义 。SMTP 是 因特网 电子 邮件 应 用 的 核心 。 如 前 所 述 ， 
SMTP 用 于 从 发 送 方 的 邮件 服务 费 发 送 报 文 到 接收 方 的 邮件 服务 问 。SMTP 问世 的 时 间 比 
HTTP 要 长 得 多 (初始 的 SMTP 协议 的 RFC 可 追 湖 到 1982 年 ， 而 SMTP 在 此 之 前 很 长 一 段 
时 间 就 已 经 出 现 了 )。 尽 管 电子 邮件 应 用 在 因特网 上 的 独特 地 位 可 以 证 明 SMTP 有 着 众多 
非常 出 色 的 性 质 ， 但 它 所 具有 的 某 种 陈旧 特征 表明 它 仍然 是 一 种 继承 的 技术 。 例 如 ， 它 限 
制 所 有 邮件 报 文 的 体 部 分 (不 只 是 其 首部 ) 只 能 采用 简单 的 7 比特 ASCI 表示 。 在 20 tH 
纪 80 年 代 里 期 ， 这 种 限制 是 明智 的 ， 因 为 当时 传输 能 力 不 足 ， 没 有 人 会 通过 电子 邮件 发 
送 大 的 附件 或 是 大 的 图 片 、 声 音 或 者 视频 文件 。 然 而 ， 在 今天 的 多 媒体 时 代 ,，7 位 ASCII 
的 限制 的 确 有 点 痛 亩 ， 即 在 用 SMTP 传送 邮件 之 前 ， 需 要 将 二 进 制 多 媒体 数据 编码 为 
ASCI 人 码 ， 并 且 在 使 用 SMTP 传输 后 要 求 将 相应 的 ASCH 码 邮 件 解码 还 原 为 多 媒体 数据 。 
2.2 节 讲 过 ， 使 用 HTTP 传送 前 不 需要 将 多 媒体 数据 编码 为 ASCII 码 。 

为 了 描述 SMTP 的 基本 操作 、 我 们 观察 一 种 常见 的 情景 。 假 设 Alice #124 Bob 发 送 一 
封 简单 的 ASCII 报 文 . 

e Alice 调用 她 的 邮件 代理 程序 并 提供 Bob 的 邮件 地 址 (例如 bob@ someschool. edu), 

撰写 报 文 ， 然后 指示 用 户 代 理发 送 该 报 文 。 

e Alice 的 用 户 代理 把 报 文 发 给 她 的 邮件 服务 器 ， 在 那里 该 报 文 被 放 在 报 文 队列 中 。 

e 运行 在 Alice 的 邮件 服务 右上 的 SMTP 客户 端 发 现 了 报 文 队列 中 的 这 个 报 文 ， 它 就 

创建 一 个 到 运行 在 Bob 的 邮件 服务 右上 的 SMTP 服务 器 的 TCP 连接 。 

。 在 经 过 一 些 初 始 SMTP 握手 后 ，SMTP 客户 通过 该 TCP 连接 发 送 Alice 的 报 文 。 

e 在 Bob 的 邮件 服务 器 上 ，SMTP 的 服务 需 端 接收 该 报 文 。Bob 的 邮件 服务 需 然 后 将 

该 报 文 放 人 Bob 的 邮箱 中 。 

e 在 Bob 方便 的 时 候 ， 他 调用 用 户 代理 阅读 该 报 文 。 

图 2-17 总 结 了 上 述 这 个 情况 。 

观察 到 下 述 现象 是 重要 的 : SMTP 一 般 不 使 用 中 间 邮 件 服 务 右 发 送 邮 件 ， 即 使 这 两 个 
邮件 服务 器 位 于 地 球 的 两 端 也 是 这 样 。 假 设 Alice 的 邮件 服务 器 在 中 国 香港 ， 而 Bob 的 服 
务 需 在 美国 圣路易斯 ， 那 么 这 个 TCP 连接 也 是 从 香港 服务 闫 到 圣路易斯 服务 顺 之 间 的 直接 
相连 。 特 别 是 ， 如 果 Bob 的 邮件 服务 器 没有 开机 ， 该 报 文 会 保留 在 Alice 的 邮件 服务 右上 
并 等 街 进行 新 的 答 试 这 意味 着 邮件 并 不 在 中 间 的 某 个 邮件 服务 需 存 留 。 
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图 例 : 
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图 2-17 Alice 条 Bob 发 送 一 条 报 文 


我 们 现在 仔细 观察 一 下 ，SMTP 是 如 何 将 一 个 报 文 从 发 送 邮件 服务 硕 传 送 到 接收 邮件 
WA we. FRAT PRE BY, SMTP 与 人 类 面对面 交往 的 行为 方式 有 许多 类 似 性 . 首先， 客户 
SMTP (运行 在 发 送 邮 件 服务 器 上 ) 在 25 hig A te — 4 BR SF A SMTP (运行 在 接收 邮 
件 服务 器 上 ) 的 TCP 连接 。 如 果 服 务 器 没有 开机 ， 客 户 会 在 稍 后 继续 尝试 连接 .一旦 连 
接 建立 ， 服 务 关 和 客户 执行 茶 些 应 用 层 的 握手 ， 就 像 人 们 在 互相 交流 前 先进 行 自我 介绍 一 
FE. SMTP 的 客户 和 服务 大 在 传输 信息 前 先 相 互 介 绍 。 在 SMTP 握手 的 阶段 ，SMTP 客户 指 
未 发 送 方 的 邮件 地 址 (产生 报 文 的 那个 人 ) 和 接收 方 的 邮件 地 址 。 一 旦 该 SMTP 客户 和 服 
务 咒 彼此 介绍 之 后 ， 客 户 发 送 该 报 文 。SMTP 能 依赖 TCP 提供 的 可 靠 数据 传输 无 差错 地 将 
邮件 投递 到 接收 服务 器 。 该 客户 如 果 有 男 外 的 报 文 要 发 送 到 该 服务 右 ， 就 在 该 相同 的 TCP 
连接 上 重复 这 种 处 理 ; 否则 ， 它 指示 TCP 关闭 连接 . 

接 下 来 我 们 分 析 一 个 在 SMTP 客户 (C) 和 SMTP 服务 器 (S) 之 间 交 换 报 文 脚本 的 例 
于 .客户 的 主机 名 为 crepes. fr, RARR EILA A hamburger. edu. VAC: 开头 的 ASCII £5 
文本 行 正 是 客户 交 给 其 TCP 套 接 字 的 那些 行 ， 以 S: 开头 的 ASCH 码 则 是 服务 顺 发 送 给 其 
TCP 套 接 字 的 那些 行 。 一 旦 创建 了 TCP 连接， 就 开始 了 下 列 过 程 . 

S: 220 hamburger.edu 
: HELO crepes.fr 
: 250 Hello crepes.fr, pleased to meet you 
: MAIL FROM: <alice@crepes.fr> 
: 250 alice@crepes.fr ... Sender ok 
: RCPT TO: <bob@hamburger.edu> 
: 250 bob@hamburger.edu ... Recipient ok 
: DATA 
: 354 Enter mail, end with “.” on a line by itself 


: Do you like ketchup? 
: How about pickles? 


: 250 Message accepted for delivery 
QUIT 
: 221 hamburger.edu closing connection 


EEP, RP MABE ARS a crepes. fr [a] AREIS 4f hamburger. edu 发 送 了 一 个 报 文 
( “Do you like ketchup? How about pickles?”) 。 作 为 对 话 的 一 部 分 ， 该 客户 发 送 了 5 条 命 
令 : HELO (是 HELLO 的 缩写 ) 、MAIL FROM, RCPT TO, DATA 以 及 QUIT。 这 些 命令 都 
是 目 解释 的 。 该 客户 通过 发 送 一 个 只 包含 一 个 句点 的 行 ， 回 服务 疮 指示 该 报 文 结束 了 -。 
(按照 ASCH 码 的 表示 方法 ， 每 个 报 文 以 CRLF. CRLF 结束 ， 其 中 的 CR 和 LF 分 别 表示 回 
车 和 换行 .) 服务 器 对 每 条 命令 做 出 回答 ， 其 中 每 个 回答 含有 一 个 回答 码 和 一 些 (可 选 
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的 ) Se CHR. 我们 在 这 里 指出 SMTP 用 的 是 持续 连接 : WR EI RS ir IL Pe 
发 往 同 一 个 接收 邮件 服务 种 ， 它 可 以 通过 同一 个 TCP 连接 发 送 这 些 所 有 的 报 文 。 对 每 个 报 
文 ， 该 客户 用 一 个 新 的 MAIL FROM crepes. fr 开始 ， 用 一 个 独立 的 句点 指示 该 邮件 的 结 
束 ， 并 且 仅 当 所 有 邮件 发 送 完 后 才 发 送 QUIT, 
我 们 强烈 推荐 你 使 用 Telnet 与 一 个 SMTP 服务 硕 进 行 一 次 直接 对 话 。 使 用 的 命令 是 
telnet serverName 25 
其 中 serverName 是 本 地 邮件 服务 融 的 名 称 。 当 你 这 么 做 时 ， 就 直接 在 本 地 主机 与 邮件 服务 
锅 之 间 建 立 一 个 TCP 连接 。 输 完 上 述 命 令 后 ， 你 立即 会 从 该 服务 需 收 到 220 回答 。 接 下 
来 ， 在 适当 的 时 机 发 出 HELO, MAIL FROM, RCPT TO, DATA, CRLF. CRLF 以 及 QUIT 
af ee 强烈 推荐 你 做 本 草 后 面 的 编程 作业 3。 在 该 作业 中 ， 你 将 在 SMTP 的 客户 
冰 实 现 一 个 简单 的 用 户 代 理 ， 它 允许 你 经 本 地 邮件 服务 豆 回 任意 的 接收 方 发 送 电 子 邮件 
报 文 。 
2.4.2 5 HTTP 的 对 比 


我 们 简要 地 比较 一 下 SMTP 和 HTTP. 这 两 个 协议 都 用 于 从 一 台 主 机 回 另 一 台 主 机 传 
送 文件 : HTTP 从 Web 服务 器 问 Web 客户 (通常 是 一 个 浏览 右 ) 传送 文件 (也 称 为 对 
Z); SMTP 从 一 个 邮件 服务 器 回 另 一 个 邮件 服务 需 传 送 文 件 〈( 即 电子 邮件 报 文 ) 。 当 进行 
文件 传送 时 ， 持 续 的 HTTP 和 SMTP 都 使 用 持续 连接 。 因 此 ， 这 两 个 协议 有 一 些 共同 特征 。 
然而 ， 两 者 之 间 也 有 一 些 重要 的 区 别 。 首 先 ，HTTP 主要 是 一 个 拉 协 议 (pull protocol), 
即 在 方便 的 时 候 ， 某 些 人 在 Web 服务 右上 装载 信息 ， 用 户 使 用 HTTP 从 该 服务 带 拉 取 这 些 
信息 。 特 别 是 TCP 连接 是 由 想 接收 文件 的 机 器 发 起 的 。 另 一 方面 ，SMTP 基本 上 是 一 个 推 
协议 (push protocol) ， 即 发 送 邮 件 服务 如 把 文件 推 铝 接收 邮件 服务 盘 。 特 别 是 ， 这 个 TCP 
连接 是 由 要 发 送 该 文件 的 机 器 发 起 的 。 

第 二 个 区 别 就 是 我 们 前 面 间 接地 提 到 过 的 ，SMTP 要 求 每 个 报 文 (包括 它们 的 体 ) 使 
用 7 比特 ASCII 码 格 式 。 如 果 某 报 文 包含 了 非 7 EI ASC 字符 (如 具有 重音 的 法 文字 
符 ) 或 二 进 制 数据 (如 图 形 文件 ) ， 则 该 报 文 必 须 按照 7 比特 ASCI 码 进 行 编码 。HTTP 数 
据 则 不 受 这 种 限制 。 

第 三 个 重要 区 别 是 如 何 处理 一 个 既 包 含 文本 又 包含 图 形 (也 可 能 是 其 他 媒体 类 型 ) 的 
文档 。 如 我 们 在 2. 2 节 知 道 的 那样 ，HTTP 把 每 个 对 象 封 又 到 它 目 己 的 HTTP 啊 应 报 文中 ， 
而 SMTP 则 把 所 有 报 文 对 象 放 在 一 个 报 文 之 中 。 


2. 4.3 邮件 报 文 格式 和 MIME 


当 Alice 给 Bob 写 一 封 邮寄 时 间 很 长 的 普通 信件 时 ， 她 可 能 要 在 信 ee 
样 的 环境 首部 信息 ， 如 Bob 的 地 址 、 她 自己 的 回复 地 址 以 及 日 期 等 。 同 样 ， 当 一 个 人 给 
一 个 人 发 送 电 子 邮件 时 ， 一 个 包含 环境 信息 的 首部 位 于 报 文 体 前 面 。 这 些 环境 信息 包括 
一 系列 首部 行 中 ， 这 些 行 由 RFC 5322 定义 。 首 部 行 和 该 报 文 的 体 用 空 行 ( 即 回 车 换行 ) 
进行 分 隔 。RFC 5322 定义 了 邮件 首部 行 和 它们 的 语义 解释 的 精确 格式 。 如 同 HTTP 协议 ， 
每 个 首部 行 包含 了 可 访 的 文本 ， 是 由 关键 词 后 跟 冒 号 及 其 值 组 成 的 。 某 些 关 键 词 是 必需 
的 ， 另 一 些 则 是 可 选 的 。 每 个 首部 必须 含有 一 个 From: 首部 行 和 一 个 To: 首部 行 ; 一 个 
首部 也 许 包 含 一 个 Subject: 首部 行 以 及 其 他 可 选 的 首部 行 。 注 意 到 下 列 事实 是 重要 的 : 这 
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些 首部 行 不 同 于 我 们 在 2. 4. 1 节 所 学 到 的 SMTP 命令 (即使 那里 也 包含 了 某 些 相同 的 词 
汇 ， 如 from 和 te) 。 那 节 中 的 命令 是 SMTP 握手 协议 的 一 部 分 ， 本 节 中 研究 的 首部 行 则 是 
邮件 报 文 自身 的 一 部 分 ， 

一 个 典型 的 报 文 首 部 看 起 来 如 下 : 

From: alice@crepes.fr 


To: bob@hamburger.edu 
Subject: Searching for the meaning of life. 


在 报 文 首 部 之 后 ， 紧 接着 一 个 空白 行 ， 然 后 是 以 ACSI 格式 表示 的 报 文 体 ， 你 应 当 用 
Telnet 回 邮 件 服 务 硕 发 送 包 含 一 些 首部 行 的 报 文 ,包括 Subject: 首部 行为 此 ， 输 入 命令 
telnet serverName 25, ， 如 在 2.4.1 节 中 讨论 的 那样 . 


2.4.4 邮件 访问 协议 


— FL SMTP 将 邮件 报 文 从 Alice 的 邮件 服务 需 交 付 给 Bob 的 邮件 服务 器 ， 该 报 文 就 被 
放 人 了 Bob 的 邮箱 中 。 在 此 讨论 中 ， 我 们 按 惯例 假定 Bob 是 通过 登录 到 服务 器 主机 ， 并 和 直 
接 在 该 主机 上 运行 一 个 邮件 阅读 程序 来 阅读 他 的 邮件 的 .直到 20 世纪 90 年 代 早 期 ， 这 都 
是 一 种 标准 方式 。 而 在 今天 ， 邮 件 访问 使 用 了 一 种 客户 -服务 器 体系 结构 ， 即 典型 的 用 户 
通过 在 用 户 端 系统 上 运行 的 客户 程序 来 阅读 电子 邮件 ， 这 里 的 端 系统 可 能 是 办 公 室 的 PC, 
便携 机 或 者 是 智能 手机 。 通 过 在 本 地 主机 上 运行 邮件 客户 程序 ， 用 户 享 受 一 系列 丰富 的 特 
性 ,包括 查看 多 媒体 报 文 和 附件 的 能 力 。 

假设 Bob (接收 方 ) 在 其 本 地 PC 上 运行 用 户 代理 程序 ， 考 虑 在 他 的 本 地 PC 上 也 放置 
一 个 邮件 服务 需 是 目 然 而 然 的 事 。 在 这 种 情况 下 ，Alice 的 邮件 服务 器 就 能 直接 与 Bob 的 
PC 进行 对 话 了 。 然而 这 种 方法 会 有 一 个 问题 。 前面 讲 过 邮件 服务 规 管 理 用 户 的 邮箱 ， 并 
且 运 行 SMTP 的 客户 端 和 服务 器 端 。 如 果 Bob 的 邮件 服务 器 位 于 他 的 PC 上 上， 那么 为 了 能 
够 及 时 接收 可 能 在 任何 时 候 到 达 的 新 邮件 ， 他 的 PC 必须 总 是 不 间断 地 运行 着 并 一 直 保 持 
在 线 。 这 对 于 大 多 数 因 特 网 用 户 而 言 是 不 现实 的 。 相 反 ， 典 型 的 用 户 通 党 在 本 地 PC 上 上 运 
行 一 个 用 户 代 理 程 序 ， 市 它 访问 存储 在 总 是 保持 开机 的 共享 邮件 服务 右上 的 邮箱 。 该 邮件 
服务 此 与 其 他 用 户 共享 ， 并 且 通 常 由 用 户 的 ISP 进行 维护 ( 如 大 学 或 公司 ) 。 

现在 我 们 考虑 当 从 Alice 向 Bob 发 送 一 个 电子 邮件 报 文 时 所 取 的 路 径 。 我们 刚才 已 经 
基 道 ， 在 沿 着 该 路 径 的 某 些 点 上 上， 电子 邮件 报 文 存放 在 Bob 的 邮件 服务 器 上 -. 通过 让 
Alice 的 用 户 代 理 直 接 向 Bob 的 邮件 服务 器 发 送 报 文 ， 就 能 够 做 到 这 一 点 。 这 能 够 由 SMTP 
来 完成 : KRE, SMTP 被 设计 成 将 电子 邮件 从 一 台 主 机 推 到 男 一 台 主 机 。 然 而 ,通常 
Alice 的 用 户 代 理 和 Bob 的 邮件 服务 右 之 间 并 没有 一 个 直接 的 SMTP 对 话 。 相 反 ， 如 图 2-18 
Ha, Alice 的 用 户 代 理 用 SMTP 将 电子 邮件 报 文 推 和 她 的 邮件 服务 占 ， 接 着 她 的 邮件 服务 
fit (TEA SMTP 客户 ) HH SMTP 将 该 邮件 中 继 到 Bob 的 邮件 服务 器 。 为 什么 该 过 程 
要 分 成 两 步 呢 ”主要 是 因为 不 通过 Alice 的 邮件 服务 器 进行 中 继 ，Alice 的 用 户 代 理 将 没有 
任何 办 法 到 达 一 个 不 可 达 的 目的 地 接收 服务 右 ，。 通 过 首先 将 邮件 存放 在 自己 的 邮件 服务 器 
中 ，Alice 的 邮件 服务 器 可 以 重复 地 尝试 向 Bob 的 邮件 服务 器 发 送 该 报 文 ， 如 每 30 分 钟 一 
次 ， 直 到 Bob 的 邮件 服务 器 变 得 运行 为 止 。( 并 且 如 果 Alice 的 邮件 服务 器 关机 ， 她 则 能 向 
系统 管理 员 进 行 申告 !) SMTP RFC 文档 定义 了 如 何 使 用 SMTP 命令 经 过 多 个 SMTP 服务 器 
进行 报 文中 继 . 

(Hse ik BSAA i | 像 Bob 这 样 的 接收 方 ， 是 如 何 通 过 运行 其 本 地 PC 
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上 的 用 户 代 理 ， 获 得 位 于 他 的 某 ISP 的 邮件 服务 器 上 的 邮件 呢 ? 值得 注意 的 是 Bob 的 用 户 
代理 不 能 使 用 SMTP 取 回 报 文 ， 因 为 取 报 文 是 一 个 拉 操 作 ， 而 SMTP 协议 是 一 个 推 协议 。 
通过 引入 一 个 特殊 的 邮件 访问 协议 来 解决 这 个 难题 ， 该 协议 将 Bob 邮件 服务 器 上 的 报 文 传 
送 给 他 的 本 地 PC. 目前 有 一 些 流行 的 邮件 访问 协议 ， 包 括 第 三 版 的 邮局 协议 (Post Office 
Protocol—Version 3, POP3) 、 因 特 网 邮件 访问 协议 (Internet Mail Access Protocol, IMAP) 
VIK HTTP., 

图 2-18 总 结 了 应 用 于 因特网 电子 邮件 的 一 些 协 议 : SMTP 用 来 将 邮件 从 发 送 方 的 邮件 
服务 硕 传 输 到 接收 方 的 邮件 服务 顺 ; SMTP 也 用 来 将 邮件 从 发 送 方 的 用 户 代 理 传送 到 发 送 
方 的 邮件 服务 部 。 如 POP3 这 样 的 邮件 访问 协议 用 来 将 邮件 从 接收 方 的 邮件 服务 咒 传 送 到 
接收 方 的 用 户 代理 ， 





图 2-18 电子 邮件 协议 及 其 通信 实体 


1. POP3 

POP3 是 一 个 极为 向 单 的 邮件 访问 协议 ， 由 RFC 1939 进行 定义 。 文档 RFC 1939 简短 
且 可 读 性 强 。 因 为 该 协议 非常 简单 ， 故 其 功能 相当 有 限 。 当 用 户 代理 (客户 ) 打开 了 一 个 
到 邮件 服务 器 (服务 大 ) 端口 110 上 的 TCP 连接 后 ，POP3 就 开始 工作 了 。 随 着 建立 TCP 
连接 ，POP3 按照 三 个 阶段 进行 工作 : 特许 (authorization) 、 事 务 处 理 以 及 更 新 。 在 第 一 个 
阶段 即 特许 阶段 ， 用 户 代 理发 送 ( 以 明文 形式 ) 用 户 名 和 口令 以 鉴别 用 户 。 在 第 二 个 阶段 
即 事务 处 理 阶段 ， 用 户 代 理 取 回 报 文 ; 同时 在 这 个 阶段 用 户 代 理 还 能 进行 如 下 操作 ， 对 报 
文 做 删除 标记 ， 取 消 报 文 删 除 标记 ， 以 及 获取 邮件 的 统计 信息 。 在 第 三 个 阶段 即 更 新 阶 
多 ， 它 出 现在 客户 发 出 了 quit 命令 之 后 ， 目 的 是 结束 该 POP3 会 话 ; 这 时 ,该 邮件 服务 器 
删除 那些 被 标记 为 删除 的 报 文 ， 

在 POPS 的 事务 处 理 过 程 中 ， 用 户 代 理发 出 一 些 命令 ， 服 务 髓 对 每 个 命令 做 出 回答 ， 
回答 可 能 有 两 种 : + OK (有 时 后 面 还 跟 有 服务 融 到 客户 的 数据 ) ， 被 服务 器 用 来 指示 前 面 
的 命令 是 正常 的 ; -ERR， 被 服务 器 用 来 指示 前 面 的 命令 出 现 了 某 些 差错 。 

特许 阶段 有 两 个 主要 的 命令 : user < user name > 和 pass < password > 。 为 了 举例 说 明 
这 两 个 命令 ， 我 们 建议 你 直接 用 Telnet 登录 到 POP3 服务 器 的 110 端口 ， 然 后 发 出 这 两 个 
命令 。 假 设 邮 件 服 务 器 的 名 字 为 mailServer， 那 么 你 将 看 到 类 似 的 过 程 : 

telnet mailServer 110 

+OK POP3 server ready 

user bob 

+OK 


pass hungry 
+OK user successfully logged on 


如 果 你 的 命令 拼写 错 了 ， 该 POP3 服务 器 将 返回 一 个 -ERR 报 文 。 
现在 我 们 来 看 一 下 事务 处 理 过 程 。 使 用 POP3 的 用 户 代 理 通常 被 用 户 配置 为 “下 载 并 
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删除 ”或 者 “下 载 并 保留 ”方式 。POP3 用 户 代 理发 出 的 命令 序列 取决 于 用 户 代 理 程序 被 

配置 为 这 两 种 工作 方式 的 哪 一 种 。 使 用 下 载 并 删除 方式 ， 用 户 代理 发 出 list, retr 和 dele fy 

令 。 举 例 来 说 ,假设 用 户 在 他 (她 ) 的 邮箱 里 有 两 个 报 文 。 在 下 面 的 对 话 中 ，C: (代表 

客户 ) 是 用 户 代理 ，S: (代表 服务 器 ) 是 邮件 服务 器 。 事 务 处 理 过 程 将 类 似 于 如 下 过 程 ; 
Ce list 


: 1 498 
x 2 912 


2 retr 1 
(blah blah ... 


$s retr 2 


S 

G 

C: quit 

S: +OK POP3 server signing off 

用 户 代理 首先 请 求 邮 件 服务 需 列 出 所 有 存储 的 报 文 的 长 度 。 接 着 用 户 代理 从 邮件 服务 
锅 取 回 并 删除 每 封 邮 件 , 注意 在 特许 阶段 以 后 ， 用 户 代 理 仅 使 用 四 个 命令 : list, retr, 
dele 和 quit， 这 些 命 令 的 语法 定义 在 RFC 1939 中 。 在 处 理 quit 命令 后 ，POP3 ARS Ave A 
更 新 阶段 ， 从 用 户 的 邮箱 中 删除 邮件 1 和 2。 

使 用 下 载 并 删除 方式 存在 的 问题 是 ， 邮 件 接收 方 Bob 可 能 是 移动 的 ， 可 能 希望 从 多 个 
不 同 的 机 禹 访问 他 的 邮件 报 文 ， 如 从 办 公 室 的 PC、 家 里 的 PC 或 他 的 便携 机 来 访问 邮件 。 
下 载 并 删除 方式 将 对 Bob 的 邮件 报 文 根 据 这 3 台 机 器 进行 划分 ， 特 别 是 如 果 Bob 最 先是 在 
他 办 公 室 的 PC 上 收取 了 一 条 邮件 ， 那 么 晚上 当 他 在 家 里 时 ， 通 过 他 的 便携 机 将 不 能 再 收 
取 该 邮件 。 使 用 下 载 并 保留 方式 ， 用 户 代 理 下 载 某 邮 件 后 ， 该 邮件 仍 保留 在 邮件 服务 器 
Eo XH}, Bob 就 能 通过 不 同 的 机 需 重 新 读 取 这 些 邮 件 ; 他 能 在 工作 时 收取 一 封 报 文 ， 而 
在 工作 回 家 后 再 次 访问 它 。 

在 用 户 代 理 与 邮件 服务 器 之 间 的 POP3 会 话 期 间 ， 该 POP3 服务 器 保留 了 一 些 状 态 信 
A; 特别 是 记录 了 哪些 用 户 报 文 被 标记 为 删除 了 。 然 而 ，POP3 服务 融 并 不 在 POP3 会 话 过 
程 中 携 市 状态 信息 。 会 话 中 不 包括 状态 信息 大 大 简化 了 POP3 服务 的 实现 。 

2. IMAP 

使 用 POP3 访问 时 ， 一 旦 Bob 将 邮件 下 载 到 本 地 主机 后 ， 他 就 能 建立 邮件 文件 夹 ， 并 
将 下 载 的 邮件 放 入 该 文件 夹 中 。 然 后 Bob 可 以 删除 报 文 ， 在 文件 夹 之 间 移 动 报 文 ， 并 查询 
报 文通 过 发 送 方 的 名 字 或 报 文 主题 )。 但 是 这 种 文件 夹 和 报 文 存放 在 本 地 主机 上 的 方式 ， 
会 给 移动 用 户 璋 来 问题 ， 因 为 他 更 喜欢 使 用 一 个 在 远程 服务 需 上 的 层次 文件 夹 ， 这 样 他 可 
以 从 任何 一 台 机 器 上 对 所 有 报 文 进 行 访问 。POP3 不 可 能 做 到 这 一 点 ，POP3 协议 没有 给 用 
户 提供 任何 创建 远程 文件 夹 并 为 报 文 指 派 文件 夹 的 方法 。 

为 了 解决 这 个 或 其 他 一 些 问题 ,由 RFC 3501 定义 的 因特网 邮件 访问 协议 (IMAP) 应 
运 而 生 。 和 POP3 一 样 ，IMAP 是 一 个 邮件 访问 协议 ,但 是 它 比 POP3 具有 更 多 的 特色 ， 不 
过 也 比 POP3 复杂 得 多 。( 因 此 客户 和 服务 硕 端 的 实现 也 都 复杂 得 多 。 ) 
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收 件 人 的 INBOX 文件 夹 相 关联 。 收 件 人 则 能 够 把 邮件 移 到 一 个 新 的 、 用 户 创 建 的 文件 夹 
中 ， 阅 读 邮 件 ， 删 除 邮件 等 。IMAP 协议 为 用 户 提 供 了 创建 文件 夹 以 及 将 邮件 从 一 个 文件 
夹 移 动 到 另 一 个 文件 夹 的 命令 ，IMAP 还 为 用 户 提 供 了 在 远程 文件 夹 中 查询 邮件 的 命令 ， 
按 指定 条 件 去 查询 匹配 的 邮件 .值得 注意 的 是 ， 与 POP3 不 同 ，IMAP 服务 化 维护 了 IMAP 
会 话 的 用 户 状 态 信息 ， 人 例如， 文件 夹 的 名 字 以 及 哪些 报 文 与 哪些 文件 夹 相 关联 。 

IMAP 的 另 一 个 重要 特性 是 它 具 有 人 允许 用 户 代 理 获 取 报 文 组 件 的 命令 。 例 如 ， 一 个 用 
户 代理 可 以 只 读 取 一 个 报 文 的 报 文 首部 ， 或 只 是 一 个 多 部 分 MIME 报 文 的 一 部 分 。 当 用 户 
代理 和 其 邮件 服务 器 之 间 使 用 低 带 宽 连 接 的 时 候 ， 这 个 特性 非常 有 用 (如 一 个 低速 调制 解 
调 需 链 路 ) 。 使 用 这 种 低 帝 宽 连 接 时 ， 用 户 可 能 并 不 想 取 回 他 邮箱 中 的 所 有 邮件 ， 尤 其 要 
避免 可 能 包含 如 音频 或 视频 片断 的 大 邮件 

3. 基于 Web 的 电子 邮件 

今天 越 来 越 多 的 用 户 使 用 他 们 的 Web 浏览 希 收 发 电子 邮件 。20 世纪 90 年 代 中 期 Hot- 
mail 引入 了 基于 Web 的 接 人 。 今 天， 谷歌 、 雅 虎 以 及 几乎 所 有 重要 的 大 学 或 者 公司 也 提供 
了 基于 Web 的 电子 邮件 ,使 用 这 种 服务 ， 用 户 代 理 就 是 普通 的 浏览 句 ， 用 户 和 他 远程 邮 
箱 之 间 的 通信 和 则 通过 HTTP 进行 。 当 一 个 收 件 人 (如 Bob), 想 从 他 的 邮箱 中 访问 一 个 报 
文 时 ， 该 电子 邮件 报 文 从 Bob 的 邮件 服务 器 发 送 到 他 的 浏览 器 ， 使 用 的 是 HTTP 而 不 是 
POP3 或 者 IMAP 协议 。 当 发 件 人 (如 Alice) 要 发 送 一 封 电子 邮件 报 文 时 ， 该 电子 邮件 报 
SCM Alice 的 浏览 费 发 送 到 她 的 邮件 服务 融 ， 使 用 的 是 HTTP 而 不 是 SMTP. Sif, Alice 
的 邮件 服务 费 在 与 其 他 的 邮件 服务 右 之 间 发 送 和 接收 邮件 时 ， 仍 然 使 用 的 是 SMTP. 


2.5 DNS: 因特网 的 目录 服务 


人 类 能 以 很 多 方式 来 标识 。 例 如 ， 我 们 能 够 通过 出 生 证 书 上 的 名 字 来 标识 ; 能 够 通过 
社会 保险 号 码 来 标识 ; 也 能 够 通过 驾驶 执照 上 的 号 码 来 标识 。 尽 管 这 些 标识 办 法 都 可 以 用 
来 识别 一 个 人 ， 但 是 在 特定 环境 下 ， 某 种 识别 方法 可 能 比 另 一 种 方法 更 为 适合 。 例 如 ， 
IRS (美国 的 一 个 声名 狼藉 的 税务 征收 机 构 ) 的 计算 机 更 喜欢 使 用 定 长 的 社会 保 , 险 号 码 而 
不 是 出 生 证 书 上 的 姓名 。 另 一 方面 ， 普 通 人 乐于 使 用 更 好 记 的 出 生 证 书 上 的 姓名 而 不 是 社 
会 保险 号 码 . ( 毫 无 疑问 ， 你 能 想象 人 们 之 间 以 这 种 方式 说 话 吗 ? 如 “你 好 ， 我 叫 
132-67-9875 。 请 找 一 下 我 的 丈夫 178-87-1146”。) 

因特网 上 的 主机 和 人 类 一 样 ， 可 以 使 用 多 种 方式 进行 标识 。 主 机 的 一 种 标识 方法 是 用 它 
的 主机 名 (hostname), ， 如 cnn. com, www. yahoo. com, gaia. cs. umass. edu 以 及 cis. poly. edu 
等 ， 这 些 名 字 便 于 记忆 也 乐于 被 人 们 接受 。 然 而 ， 主 机 名 几乎 没有 提供 (即使 有 也 很 少 ) 
关于 主机 在 因特网 中 位 置 的 信息 。 (一 个 名 为 www. eurecom. fr 的 主机 以 国家 人 码 .fr 255 
告诉 我 们 该 主机 很 可 能 在 法 国 ， 仅 此 而 已 .) 况且 ， 因 为 主机 名 可 能 由 不 定 长 的 字母 数字 
组 成 ， 路 由 顺 难 以 处 理 。 由 于 这 些 原因 ， 主 机 也 可 以 使 用 所 谓 IP 地 址 (IP address) 进行 
标识 。 

我 们 将 在 第 4 和 章 更 为 详细 地 讨论 IP 地 址 ， 但 现在 向 略 地 介绍 一 下 还 是 有 必要 的 。 一 
个 IP 地 址 由 4 个 字 节 组 成 ,并 有 着 严格 的 层次 结构 。 例 如 121. 7. 106. 83 这 样 一 个 IP 地 
址 ， 其 中 的 每 个 字 市 都 被 句点 分 隐 开 来 ,表示 了 0 ~255 的 十 进 制 数字 。 我 们 说 IP 地 址 具 
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有 层次 结构 ， 是 因为 当 我 们 从 左 至 右 扫描 它 时 ， 我 们 会 得 到 越 来 越 具 体 的 关于 主机 位 于 因 
特 网 何 处 的 信息 ( 即 在 众多 网 络 的 哪个 网 络 里 ) 。 类 似 地 ， 当 我 们 从 下 向 上 查看 邮政 地 址 
时 ， 我 们 能 够 获得 该 地 址 位 于 何 处 的 越 来 越 具 体 的 信息 。 


2.5.1 DNS 提供 的 服务 


我 们 刚刚 看 到 了 识别 主机 有 两 种 方式 ， 通 过 主机 名 或 者 IP 地址 ，、 人 们 喜欢 便于 记忆 
的 主机 名 标识 方式 ， 而 路 由 硕 则 况 欢 定 长 的 、 有 着 层次 结构 的 IP 地 址 。 为 了 折衷 这 些 不 
同 的 偏好 ， 我 们 需要 一 种 能 进行 主机 名 到 IP 地 址 转换 的 目录 服务 。 这 就 是 域名 系统 
(Domain Name System, DNS) 的 主要 任务 。DNS 是 : 由 一 个 由 分 层 的 DNS 服务 器 (DNS 
server) 实现 的 分 布 式 数据 库 ; 人 一 个 使 得 主机 能 够 查询 分 布 式 数据 库 的 应 用 层 协议 。 
DNS 服务 大 通常 是 运行 BIND (Berkeley Internet Name Domain) 软件 [ BIND 2012] 的 
UNIX 机 器 。DNS 协议 运行 在 UDP 之 上 ， 使 用 53 号 端口 。 





DNS: 通过 客户 - 服务 器 模式 提供 的 重要 网 络 功能 


与 HTTP, FTP 和 SMTP 协议 一 样 ，DNS 协议 是 应 用 层 协议 ， 其 原因 在 于 : DEA 
客户 -服务 器 模式 运行 在 通信 的 端 系统 之 间 ; 四 在 通信 的 端 系统 之 间 通 过 下 面 的 端 到 端 
运输 协议 来 传送 DNS 报 文 。 然 而 ， 在 其 他 意义 上 ，DNS 的 作用 非常 不 同 于 Web 应 用 、 
文件 传输 应 用 以 及 电子 邮件 应 用 。 与 这 些 应 用 程序 不 同 之 处 在 于 ，DNS 不 是 一 个 直接 和 
用 户 打 交道 的 应 用 ,相反 ，DNS 是 为 因特网 上 的 用 户 应 用 程序 以 及 其 他 软件 提供 一 种 核 
心 功能 ， 即 将 主机 名 转换 为 其 背后 的 IP 地址 。 我 们 在 1.2 节 就 提 到 ， 因 特 网 体系 结构 
的 复杂 性 大 多 数位 于 网 络 的 “边缘 ”，DNS 通过 采用 了 位 于 网 络 边 缘 的 客户 和 服务 器 ， 
实现 了 关键 的 名 字 到 地 址 转换 功能 ， 它 还 是 这 种 设计 原理 的 另 一 个 范例 。 


DNS 通 弟 是 由 其 他 应 用 层 协 议 所 使 用 的 ， 包括 HTTP, SMTP 和 FTP， 将 用 户 提供 的 主 
机 名 解析 为 IP 地 址 。 举 一 个 例子 ， 考 虑 当 某 个 用 户主 机 上 的 一 个 浏览 器 ( 即 一 个 HTTP 
客户 ) 请 求 URL www. someschool. edu/index. html 页 面 时 会 发 生 什 么 现象 。 为 了 使 用 户 的 
主机 能 够 将 一 个 HTTP 请 求 报 文 发 送 到 Web 服务 器 www. someschool. edu， 该 用 户主 机 必须 
获得 www. someschool. edu 的 IP 地址 。 其 做 法 如 下 。 

。 同一 人 台 几 户主 机 上 运行 着 DNS 应 用 的 客户 端 。 

e Nia A EI URL 中 抽取 出 主机 名 www. someschool. edu， 并 将 这 台 主 机 名 传 给 

DNS 应 用 的 客户 端 。 

e DNS 客户 向 DNS 服务 器 发 送 一 个 包含 主机 名 的 请 求 。 

© DNS 客户 最 终 会 收 到 一 份 回答 报 文 ， 其 中 含有 对 应 于 该 主机 名 的 IP 地 址 。 

e — Fare BSR A DNS AYIA IP 地 址 ， 它 能 够 同位 于 该 IP 地 址 80 端口 的 HTTP 

服务 各 进程 发 起 一 个 TCP 连接 。 

从 这 个 例子 中 ， 我们 可 以 看 到 DNS 给 使 用 它 的 因特网 应 用 带 来 了 额外 的 时 延 ， 有 时 

还 相当 可 观 。 芋 运 的 是 ， 如 我 们 下 面 讨 论 的 那样 ， 想 获得 的 IP 地 址 通常 就 缓存 在 一 个 
“附近 的 ”DNS 服务 器 中 ， 这 有 助 于 减少 DNS 的 网 络 流量 和 DNS 的 平均 时 延 
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除了 进行 主机 名 到 IP 地 址 的 转换 外 ，DNS 还 提供 了 一 些 重 要 的 服务 : 
© 主机 别名 (host aliasing) ， 有 着 复杂 主机 名 的 主机 能 拥有 一 个 或 者 多 个 别名 。 例 
如 ， 一 人 台 名 为 relayl. west- coast. enterprise. com 的 主机 ， 可 能 还 有 两 个 别名 为 enter- 
prise. com 和 www. enterprise. com, 在 这 种 情况 下，relay1. west- coast. enterprise. com 
也 称 为 规范 主机 名 (canonical hostname ) 。， 主 机 别名 〈 当 和 存在 时 ) 比 主机 规范 名 更 
加 容易 记忆 。 应 用 程序 可 以 调用 DNS 来 获得 主机 别名 对 应 的 规范 主机 名 以 及 主机 
的 LIP 地 址 。 
邮件 服务 器 别名 (mail server aliasing)。 显 而 易 见 ， 人 们 也 非常 希望 电子 邮件 地 址 
好 记忆 。 例 如 ， 如 果 Bob 在 Hotmail 上 有 一 个 账户 ，Bob 的 邮件 地 址 就 像 bob@ hot- 
mail. com 这 样 简 单 。 然 而 ，Hotmail ARFERIR I REAS EBLA AREENA, AR hol- 
mail. com 那样 简单 好 记 ( 例 如， 规范 主机 名 可 能 像 relay]. west- coast. hotmail. com 
那样 )， 电 子 邮 件 应 用 程序 可 以 调用 DNS， 对 提供 的 邮件 服务 器 别名 进行 解析 ， 上 
获得 该 主机 的 规范 主机 名 及 其 IP Hh PEE., MX 记录 (参见 后 面 ) 允许 一 个 
公司 的 邮件 服务 各 和 Web IRA aE HATA] (AA) 的 主机 名 ; 例如， 一 个 公 
司 的 Web He 5 at AIAG AER F ae AB HE MY fi enterprise. com. 
负载 分 配 (load distribution), DNS HLA] FETC AAR Ae (ANI ATAY Web vn 
等 ) 之 间 进 行 负 载 分 配 。 繁 忙 的 站 点 (如 cenn. com) PICT Th Ew Fa AB 
每 台 服 务 需 均 运 行 在 不 同 的 端 系统 上 ， 每 个 都 有 着 不 同 的 IP 地 址 。 由 于 这 些 元 余 
的 Web 服务 各 ,一 个 IP 地 址 集合 因此 与 同一 个 规范 主机 名 相 联 系 。DNS 数据 库 中 
存储 着 这 些 IP 地 址 集合 。 当 客 户 对 映射 到 某 地 址 集合 的 名 字 发 出 一 个 DNS 请 求 
时 ， 该 服务 带 用 IP 地 址 的 整个 集合 进行 啊 应 ， 但 在 每 个 加 谷中 循环 这 些 地 址 次 
序 。 因 为 客户 通 弟 总 是 向 IP 地 址 排 在 最 前 面 的 服务 需 发 送 HTTP 请 求 报 文 ， 所 以 
DNS WEE PT ATX ZEIT AR AY Web 服务 顺 之 间 循 环 分 配 了 了 负载， DNS 的 循环 同样 可 以 
用 于 邮件 服务 器 ， 因 此 ， 多 个 邮件 服务 器 可 以 具有 相同 的 别名 ， 一 些 内 容 分 发 公 
可 如 Akamai 也 以 更 加 复杂 的 方式 使 用 DNS [ Dilley 2002 | ， 以 提供 Web NEDE 
(参见 第 7 HF). 

DNS 由 RFC 1034 和 RFC 1035 定义 ， 并 且 在 几 个 附加 的 REC 中 进行 了 更 新 。DNS 是 
一 个 复杂 的 系统 ,我们 在 这 里 只 是 就 其 运行 的 主要 方面 进行 学 习 。 感 兴趣 的 读者 可 以 参考 
这 些 RFC 文档 和 Albitz 和 Liu 写 的 书 | Albitz 1993 | ; 亦 可 参阅 文章 | Mockapetris 1998 | 
和 | Mockapetris 2005 | ， 其 中 [ Mockapetris 1998] 是 回顾 性 的 文 草 ， 它 提供 了 DNS 组 成 和 
工作 原理 的 精细 的 描述 


2.5.2 DNS 工作 机 理 概 述 


下 面 给 出 一 一 个 DNS 工作 过 程 的 总 体 概 括 ， 我 们 的 讨论 将 集中 在 主机 名 到 IP 地 址 转换 
服务 方面 

假设 运行 在 用 户主 机 上 的 某 些 应 用 程序 (如 Web 浏览 器 或 邮件 阅读 需 ) 需要 将 主机 
名 转换 为 IP 地 址 。 这 些 应 用 程序 将 调用 DNS 的 客户 端 ， 并 指明 需要 被 转换 的 主机 名 (在 
很 多 基于 UNIX 的 机 右上 ， 应 用 程序 为 了 执行 这 种 转换 需要 调用 哨 数 gethostbyname () ) - 
用 户主 机 上 的 DNS 接收 到 后 ， 向 网 络 中 发 送 一 个 DNS 查询 报 文 。 所 有 的 DNS 请 求 和 回答 
报 文 使 用 UDP 数据 报 经 绒 口 53 发 送 。 经 过 大 十 上 密 秒 到 大 十 秒 的 时 延 后 ， 用 户主 机 上 的 
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DNS 接收 到 一 个 提供 所 硕 望 映射 的 DNS 回答 报 文 。 这 个 映射 结果 则 被 传递 到 调用 DNS 的 
应 用 程序 。 因 此 ， 从 用 户主 机 上 调用 应 用 程序 的 角度 看 ，DNS 是 一 个 提供 人 简单、 直接 的 转 
换 服 务 的 黑 盒 子 。 但 事实 上 ， 实 现 这 个 服务 的 黑 盒子 非常 复杂 ， 它 由 分 布 于 全 球 的 大 量 
DNS 服务 器 以 及 定义 了 DNS 服务 器 与 查询 主机 通信 方式 的 应 用 层 协 议 组 成 。 

DNS 的 一 种 简单 设计 是 在 因特网 上 只 使 用 一 个 DNS 服务 硕 ， 该 服务 需 包 含 所 有 的 映 
射 。 在 这 种 集中 式 设 计 中 ， 客 户 直 接 将 所 有 查询 直接 发 往 单 一 的 DNS 服务 器 ， 同 时 该 
DNS 服务 希 下 接 对 所 有 的 查询 客户 做 出 响应 。 尽 管 这 种 设计 的 简单 性 非常 具有 了 吸引 力 ， 但 
它 不 适用 于 当今 的 因特网 ， 因 为 因特网 有 着 数量 巨大 (并 持续 增长 ) 的 主机 。 这 种 集中 式 
设计 的 问题 包括 : 

e 单 点 故障 (a single point of failure ) 。 如 果 该 DNS 服务 器 天 省 ， 整 个 因特网 随 之 

次 痪 ! 

e 通信 容量 (traffic volume), HA DNS 服务 需 不 得 不 处 理 所 有 的 DNS 查询 (用 于 为 
上 亿 台 主机 产生 的 所 有 HTTP 请 求 报 文 和 电子 邮件 报 文 服务 ) 。 

e 远 距离 的 集中 式 数 据 库 (distant centralized database ) 。 单 个 DNS 服务 器 不 可 能 
“邻近 ”所 有 查询 客户 。 如 果 我 们 将 单 台 DNS 服务 器 放 在 纽约 市 ， 那 么 所 有 来 自 
澳大利亚 的 查询 必须 传播 到 地 球 的 另 一 边 ， 中 间 也 许 还 要 经 过 低速 和 拥塞 的 链 路 。 
这 将 导致 严重 的 时 延 。 

e 维护 (maintenance), $A DNS 服务 硕 将 不 得 不 为 所 有 的 因特网 主机 保留 记录 。 
这 不 仅 将 使 这 个 中 央 数 据 库 非常 庞大 ， 而 且 它 还 不 得 不 为 解决 每 个 新 添加 的 主机 
而 频繁 更 新 。 

总 的 来 说 ， 在 单一 DNS 服务 器 上 运行 集中 式 数 据 库 完全 没有 可 扩展 能 力 。 因 此 ，DNS 

采用 了 分 布 式 的 设计 方案 。 事 实 上 ，DNS 是 一 个 在 因特网 上 实现 分 布 式 数据 库 的 精彩 范例 。 





图 2-19 DNS 服务 器 的 部 分 层次 结构 


1. 分 布 式 、 层 次 数据 库 

为 了 处 理 扩 展 性 问题 ，DNS 使 用 了 大 量 的 DNS 服务 器 ， 它 们 以 层次 方式 组 织 ， 并 且 
分 布 在 全 志 界 泡 围 内 。 没 有 一 台 DNS 服务 需 拥 有 因特网 上 所 有 主机 的 映射 。 相 反 ， 该 映 
射 分 布 在 所 有 的 DNS 服务 器 上 。 大 致 说 来 ， 有 3 种 类 型 的 DNS 服务 器 : 根 DNS WR Fé 
顶级 域 (Top-Level Domain, TLD) DNS 服务 器 和 权威 DNS 服务 器 。 这 些 服务 器 以 图 2-19 
中 所 示 的 层次 结构 组 织 起 来 。 为 了 理解 这 3 种 类 型 的 DNS 服务 器 交互 的 方式 ， 假 定 一 个 
DNS 客户 要 决定 主机 名 www. amazon. com 的 IP 地址。 粗略 说 来 ， 将 发 生 下 列 事件 。 客 户 首 
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先 与 根 服务 器 之 一 联系 ， 它 将 返回 顶级 域名 com AY TLD 服务 器 的 IP 地址 。 该 客户 则 与 这 
HE TLD 服务 部 之 一 联系 ， 它 将 为 amazon. com 返回 权威 服务 硕 的 IP 地 址 。 最 后 ， 该 客户 与 
amazon. com 权威 服务 占 之 一 联系 ， 它 为 主机 名 www. amazon. com 返回 其 IP He ht- 我 们 将 
很 快 更 为 详细 地 考察 DNS 查找 过 程 。 不 过 我 们 先 仔 细 看 一 下 这 3 种 类 型 的 DNS 服务 硕 。 
。 根 DNS 服务 器 。 在 因特网 上 有 13 个 根 DNS IRB (标号 为 A FIM), 它们 中 的 
大 部 分 位 于 北美 洲 。 网 2-20 中 显示 的 是 一 张 2012 年 的 根 DNS 服务 大 分 布 图 ; 通 
过 | Root-servers 2012] 可 查看 当前 可 用 的 根 DNS 服务 需 列 表 。 尽 管 我 们 将 这 13 个 
根 DNS 服务 硕 中 的 每 个 都 视 为 单个 的 服务 硕 ， 但 每 台 “ 服 务 需 ”实际 上 是 一 个 了 元 余 
服务 希 的 网 络 ， 以 提供 安全 性 和 可 靠 性 到 了 2011 年 秋季， 共有 247 个 根 服 务 需 。 
e 顶级 域 (DNS) 服务 器 。 这 些 服 务 需 负责 项 级 域名 如 com, org, net, edu 和 gov, 
以 及 所 有 国家 的 顶级 域名 如 uk , fr, ca 和 jp. Verisign Global Registry Services 公司 
维护 com 顶级 域 的 TLD fie $45; Educause 公司 维护 edu 顶级 域 的 TLD ARS 48. Hr 
有 顶级 域 的 列表 参见 [IANA TLD 2012]. 
e 权威 ONS 服务 器 。 在 因特网 上 具有 公共 可 访问 主机 (如 Web 服务 全 和 邮件 服务 
fit) 的 每 个 组 织 机 构 必 须 提 供 公 共 可 访问 的 DNS 记录 ， 这 些 记录 将 这 些 主 机 的 名 
“FART A IP 地 址 。 一 个 组 织 机 构 的 权威 DNS 服务 天 收藏 了 这 些 DNS 记录 。 一 个 
组 织 机 构 能 够 选择 实现 它 自己 的 权威 DNS 服务 器 以 保存 这 些 记 录 ; 另 一 种 方法 
是 ,该 组 织 能 够 支付 费用 ， 让 这 些 记 录 存 储 在 某 个 服务 提供 商 的 一 个 权威 DNS AR 
务 伪 中。 多 数 大 学 和 大 公司 实现 和 维护 它们 自己 基本 和 辅助 (备份 ) 的 权威 DNS 
Ne FH o 


c. Cogent, Herndon, 弗 吉 利 亚 州 (5 个 其 他 位 置 ) 
d. U Maryland College Park, 马里 兰州 
h. ARL Aberdeen, 马里 兰州 


e. NASA Mt View, 加利福尼亚 州 了 rs Dulles. 7 AREH 《69 个 其 他 位 置 ， 


f 因特网 软件 公司 
MAREI C 















g. 美国 国防 部 C 
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a. Verisign, Los Angeles, JAA /2 Ho Í 
(5 个 其 他 位 置 ) 

b. USC-ISI Marina del Rey， 加 利 福 忆 

l. ICANN Los Angeles, 加 利 福 尼 亚 州 ” 
(41 个 其 他 位 置 ) Tt 


. WIDE 东京 
* 5 个 其 他 位 置 ) 
Nh 





图 2-20 2012 年 的 DNS BARS A ( 名称、 组 织 和 位 置 ) 


根 、TLD 和 权威 DNS 服务 器 都 处 在 该 DNS 服务 器 的 层次 结构 中 ， 如 图 2-19 中 所 示 。 
还 有 男 一 类 重要 的 DNS， 称 为 本 地 DNS 服务 器 (local DNS server) 。 一 个 本 地 DNS IRI 48 
严格 说 来 并 不 属于 该 服务 器 的 层次 结构 ， 但 它 对 DNS 层次 结构 是 重要 的 。 每 个 ISP (如 一 
个 大 学 、 一 个 系 、 一 个 公司 或 一 个 居民 区 的 ISP) 都 有 一 台 本 地 DNS 服务 器 (也 叫 默认 名 
字 服 务 器 ) 。 当 主机 与 某 个 ISP 连接 时 ,该 ISP 提供 一 台 主 机 的 IP 地 址 ， 该 主机 具有 一 人 台 











或 多 台 其 本 地 DNS 服务 器 的 IP 地 址 (通常 通过 DHCP， 将 在 第 4 章 中 讨论 ) ， 通 过 访问 
Windows 或 UNIX 的 网 络 状态 窗口 ， 能 够 容易 地 确定 你 本 地 DNS 服务 占 的 IP 地 址 .主机 的 
本 地 DNS 服务 器 通常 “邻近 ”本 主机 。 对 某 机 构 ISP 而 言 ， 本 地 DNS 服务 器 可 能 就 与 主 
机 在 同一 个 局 域 网 中 ; 对 于 某 届 民 区 TISP 来 说 ， 本 地 DNS 服务 俘 通 贡 与 主机 相隔 不 超过 几 
AH ir MEHLER DNS 请 求 时 ， 该 请 求 被 发 往 本 地 DNS 服务 咒 ， 它 起 着 代理 的 作用 
并 将 该 请 求 转发 到 DNS 服务 硕 层 次 结构 中 ， 我 们 下 面 将 更 为 详细 地 讨论 . 

我 们 来 看 一 个 简单 的 例子 ， 假 设 主机 cis. poly. edu HAUK EHL gaia. cs. umass. edu 的 IP 
地 址 ， 同 时 假设 理工 大 学 (Polytechnic) 的 本 地 DNS IR % #8 A dns. poly. edu, JF H. 
gaia. cs. umass. edu 的 权威 DNS 服务 可 为 根 DNS 服 务 器 
dns. umass. edu, 40 AJ 2- 21 所 示 ， 主 机 | ag 
cis. poly. edu 首先 回 它 的 本 地 DNS IRI Ay 
dns. poly. edu 发 送 一 个 DNS 查询 报 文 。 该 
查询 报 文 含有 被 转换 的 主机 名 gaia. es. 
umass. edu. 本 地 DNS AR 884% AR MEK 
到 根 DNS IRI AE AAR DNS IRI aie ES BY 
其 edu 前 级 并 向 本 地 DNS 服务 器 返回 负责 
edu 的 TLD 的 IP 地 址 列表 。 该 本 地 DNS 服 本 地 DNS 服 务 器 


务 器 则 再 次 向 这 些 TLD 服务 器 之 一 发 送 查 "Po Y's 外、 AAA 

WR- iZ TLD 服务 大 注意 到 umass. edu t | 

前 级 ， 并 用 权威 DNS 服务 器 的 IP 地 址 进行 T L : 
KRE. BEER DNS 服务 器 是 负责 马萨诸塞 \ T E 





大 学 的 dns. umass. edu。 最 后 ， 本 地 DNS 服 
5 r H Ikl) dns. umass. edu qt A A iA FR, 
dns. umass. edu 用 gaia. cs. umass. edu 的 IP A 
地 址 进行 啊 应 。 注意 到 sah 例 中 ， 为 了 获 请 求 主机 
得 一 台 主 机 名 的 映射 ， 共 发 送 了 8 份 DNS c$s-poly.edu 
报 文 : 4 份 查 询 报 文 和 4 份 回 答 报 文 ! 我 们 
将 很 快 看 到 利用 DNS 绥 存 减少 这 种 查询 流 
量 的 方法 。 图 2-21 各 种 DNS 服务 部 的 交互 

我 们 前 面 的 例子 假设 了 TLD 服务 需 知 道 用 于 主机 的 权威 DNS FR AR AY IP 地 址 。 一般 
而 言 ， 这 种 假设 并 不 总 是 正确 的 。 相 反 ，TLD 服务 器 只 是 知道 中 间 的 某 个 DNS 服务 前 ， 
该 中 间 DNS 服务 器 依次 才能 知道 用 于 该 主机 的 权威 DNS AR Ae. PAG, FR I SS pA 
寨 大 学 有 一 台 用 于 本 大 学 的 DNS 服务 器 ， 它 称 为 dns. umass. edu。 同 时 假设 该 大 学 的 每 个 
系 都 有 自己 的 DNS 服务 器 ， 每 个 系 的 DNS 服务 需 是 本 系 所 有 主机 的 权威 服务 器 。 在 这 种 
情况 下 ， 当 中 间 DNS 服务 器 dns. umass. edu 收 到 了 对 某 主 机 的 请 求 时 ， 该 主机 名 是 以 
cs. umass. edad 结尾 、 它 问 dns. poly. edu 返回 dns. cs. umass. edu AY IP 地 址 ， 后 者 是 所 有 以 
cs. umass. edu 结尾 的 主机 的 权威 服务 器 。 本 地 DNS AR 4 #§ dns. poly. edu 则 回 权 威 DNS AR 
务 需 发 送 查 询 ， 该 权威 DNS 服务 器 将 请 求 的 映射 发 送 给 本 地 DNS 服务 和 项， 该 本 地 服务 大 
依次 向 请 求 主机 返回 该 映射 。 在 这 个 例子 中 ， 共 发 送 了 .10 ft DNS 报 文 ! 

图 2-21 所 示 的 例子 利用 了 递归 查询 (recursive query) AZAR AA (iterative query). M 





权威 DNS 服务 器 


dns.umass.edu 






galia.cS.umass.edu 
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cis. poly. edu 到 dns. poly. edu 发 出 的 查询 是 递归 查询 ， 因 为 该 查询 请 求 dns. poly. edu 以 自己 的 
名 义 获 得 该 映射 。 而 后 继 的 3 个 查询 是 迭代 查询 ， 央 为 所 有 的 回答 部 是 直接 返回 给 
dns. poly. edu。 从 理论 上 讲 ， 任 何 DNS 查询 婚 根 DNS 服 务 器 

Neck (CA AE EVA AY. Bilan, Pel 2-22 = 

显示 了 一 条 DNS 查询 链 ， 其 中 的 所 有 查询 都 ia 

是 递归 的 。 实 践 中 ， 碍 询 通常 遵循 图 2-21 中 Fos "o 

的 模式 。 从 请 求 主机 到 本 地 DNS 服务 器 的 查 Any A, 





询 是 递归 的 ， 其 余 的 查询 是 迭代 的 . 
2. DNS 缓存 





至 此 我 们 的 讨论 还 没有 涉及 DNS 系统 = | r 
的 一 个 非常 重要 特色 ， DNS 缓存 (DNS 。 本 地 DNS 服务 a 
caching) 。 实 际 上 ， 为 了 改善 时 延性 能 并 减 | 
少 在 因特网 上 到 处 传输 的 DNS 报 文 数量 ， | 9 | 
DNS 广泛 使 用 了 缓存 技术 。DNS 缓存 的 原 (3 | 了 
理 非常 简单 。 在 一 个 请 求 链 中 ， 当 某 DNS | 


服务 器 接收 一 个 DNS 回答 (例如 ， 包 含 主 
机 名 到 IP 地 址 的 映射 ) 时 ， 它 能 将 该 回答 | 
中 的 信息 缓存 在 本 地 存储 器 中 - 例如 , 在 ES 
图 2-21 中 ， 每 当 本 地 DNS 服务 器 dns. poly, | WR ER SS 
edu 从 某 个 DNS 服务 器 接收 到 一 个 回答 ， 
它 能 够 缓存 包含 在 该 回答 中 的 任何 信息 。 
如 果 在 DNS 服务 器 中 缓存 了 一 台 主 机 名 /ZIP 
地 址 对 ， 男 一 个 对 相同 主机 名 的 查询 到 达 
该 DNS 服务 器 时 ， 该 DNS 服务 器 就 能 够 提 图 2-22 DNS 中 的 递归 查询 
供 所 要 求 的 IP 地址， 即使 它 不 是 该 主机 名 的 权威 服务 右 。 由 于 主机 和 主机 名 与 IP HOLE 
的 上 映射 并 不 是 永久 的 ，DNS 服务 需 在 一 段 时 间 后 (通常 设置 为 两 天 ) 将 丢弃 缓存 的 信息 . 
举 一 个 例子 ， 假 定 主机 apricot. poly. edu 回 dns. poly. edu 查询 主机 名 cnn. com fy IP 地 
址 。 此 后 ,假定 过 了 几 个 小 时 ，Polytechnic 理工 大 学 的 另外 一 台 主 机 如 kiwi. poly. edu 也 加 
dns. poly. edu 查询 相同 的 主机 名 。 因 为 有 了 组 在 ， 该 本 地 DNS 服务 需 可 以 立即 返回 
enn. com 的 IP 地 址 ， 而 不 必 查 询 任何 其 他 DNS 服务 器 。 本 地 DNS 服务 需 也 能 够 缓存 TLD 
服务 器 的 IP 地 址 ， 因 而 允许 本 地 DNS 绕 过 查询 链 中 的 根 DNS 服务 器 (RAR AE). 


2.5.3 DNS 记录 和 报 文 


共同 实现 DNS 分 布 式 数据 库 的 所 有 DNS 服务 硕 存 储 了 资源 记录 (Resource Record, 
RR), RR 提供 了 主机 名 到 IP 地 址 的 映射 。 每 个 DNS 回答 报 文 包含 了 一 条 或 多 条 资源 记 
Ko 在 本 小 节 以 及 后 续 小 节 中 ， 我 们 概要 地 介绍 DNS 资源 记录 和 报 文 ; 更 详细 的 信息 可 
以 在 [ Albitz 1993] 或 有 关 DNS 的 RFC 文档 [RFC 1034; RFC 1035] 中 找到 。 

资源 记录 是 一 个 包含 了 下 列 字 段 的 4 元 组 : 

(Name, Value, Type, TTL) 








gaia.csS.umass.edu 
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TTL 是 该 记录 的 生存 时 间 ， 它 决定 了 资源 记录 应 当 从 缓存 中 删除 的 时 间 。 在 下 面 给 出 
的 记录 例子 中 ， 我 们 忽略 掉 TTL 字段 。Name 和 Value 的 值 取决 于 Type: 
e 如 采 Type =A， 则 Name 是 主机 名 ，Value 是 该 主机 名 对 应 的 下 地 址 。 因 此 ， 一 条 
类 型 为 A 的 资源 记录 提供 了 标准 的 主机 名 到 IP 地 址 的 上 映射。 例如 (relayl. 
bar. foo. com, 145. 37. 93. 126, A) 就 是 一 条 类 型 A 记录 。 
e 如 果 Type=NS， 则 Name 是 个 域 (如 foo. com), mi Value 是 个 知道 如 何 获 得 该 域 
中 主机 IP 地 址 的 权威 DNS 服务 右 的 主机 名 。 这 个 记录 用 于 沿 着 查询 链 来 路 由 DNS 
查询 。 例 如 (foo. com, dns. foo. com, NS) 就 是 一 条 类 型 为 NS 的 记录 。 
e 如 果 Type =CNAME， 则 Value 是 别 名 为 Name 的 主机 对 应 的 规 江 主 机 名 > Idx 
能 够 回 查 询 的 主机 提供 一 个 主机 名 对 应 的 规范 主机 名 ， 例 如 (foo. com，relayl. 
bar. foo. com, CNAME) 就 是 一 条 CNAME 类 型 的 记录 。 
© 如 果 Type = MX， 则 Value 是 个 别名 为 Name 的 邮件 服务 需 的 规范 主机 名 。 举 例 来 
Wi, (foo. com, mail. bar. foo. com, MX) 就 是 一 条 MX iex., MX 记录 人 允许 邮件 服 
务 硕 主机 名 具有 简单 的 别名 。 值 得 注意 的 是 ， 通 过 使 用 MX 记录 ， 一 个 公司 的 邮 
PPAR a AAR ae EKI Web WR ae) 可 以 使 用 相同 的 别名 。 为 了 获得 邮 
件 服务 需 的 规范 主机 名 ，DNS 客户 应 当 请 求 一 条 MX 记录 ; 而 为 了 获得 其 他 服务 
右 的 规范 主机 名 ，DNS 客户 应 当 请 求 CNAME 记录 。 
如 果 一 台 DNS 服务 硕 是 用 于 某 特定 主机 名 的 权威 DNS 服务 器 ， 那 么 该 DNS IRA 8 
有 一 条 包含 该 主机 名 的 类 型 A 记录 (即使 该 DNS 服务 需 不 是 其 权威 DNS IIR AE, Et 
能 在 缓存 中 包含 有 一 条 类 型 A 记录 ) 。 如 果 服 务 硕 不 是 用 于 某 主 机 名 的 权威 服务 器 ， 那 么 
该 服务 带 将 包含 一 条 类 型 NS 记录 ， 该 记录 对 应 于 包含 主机 名 的 域 ; 它 还 将 包括 一 条 类 型 
A 记录 ， 该 记录 提供 了 在 NS 记录 的 Value 字段 中 的 DNS 服务 器 的 IP 地址。 举例 来 说 ， 假 
设 一 台 edu TLD 服务 右 不 是 主机 gaia. cs. umass. edu 的 权威 DNS AR #8, WARS ASH E 
含 一 条 包括 主机 cs. umass. edu 的 域 记 录 ， 如 (umass. edu, dns. umass. edu, NS); 该 edu 
TLD 服务 器 还 将 包含 一 条 类 型 A 记录 ， 如 (dns. umass. edu，128. 119. 40. 111，A) ， 该 记 
录 将 名 字 dns. umass. edu 映射 为 一 个 IP 地 址 。 

1. DNS 报 文 

ERTAK, RIEA T DNS 查询 和 回答 报 文 。DNS 只 有 这 两 种 报 文 ， 并 且 ， 查 询 
和 回答 报 文 有 着 相同 的 格式 ， 如 图 2-23 所 示 。DNS 报 文 中 各 字段 的 语义 如 下 : 











”| 查询 的 名 字 和 类 型 字段 
上 对 查询 的 响应 中 的 RR 


~ 权威 服务 器 的 记录 





-可 被 使 用 的 附加 “有 帮助 的 "信息 


图 2-23 DNS 报 文 格式 
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e 前 12 个 字 节 是 首部 区 域 ， EN 第 一 个 字段 (标识 符 ) 是 一 个 16 比 
特 的 数 ， 用 于 标识 该 查询 。 这 个 标识 符 会 被 复制 到 对 查询 的 回答 报 文 中 ， 以 便 让 
客户 用 它 来 四 配 改 rade the 标志 字段 中 含有 寿 干 标志 。1 比特 
的 “查询 /回答 ”标志 位 指出 报 文 是 查询 报 文 (0) 还 是 回答 报 文 (1)。 当 某 DNS 
服务 天 是 所 请 求 名 字 的 权威 DNS 服务 带 时 ，1 比特 的 “权威 的 ”标志 位 被 置 在 回答 
报 文中 。 如 果 客 户 (主机 或 者 DNS IRIA) Pil REAA ECORI Ar BE 
行 递归 查询 ， 将 设置 1 比特 的 “和 希望 递归 ”标志 位 。 如 果 该 DNS IRI aie 5c FFA 
询 ， 在 它 的 回答 报 文中 会 对 1 比特 的 “递归 可 用 ”标志 位 置 位 。 在 该 首部 中 ， 还 有 


4 个 有 关 数 量 的 字段 ， 这 些 字段 re Dha Aa E 
。 问题 区 域 包含 着 正在 进行 的 查询 信息 。 该 区 域 包 括 : 山名 字 字 段 ， 指 出 正在 被 查 


询 的 主机 名 字 ; 凶 类 型 字段 ， En 例如 主 
机 地 址 是 与 一 个 名 字 相 关联 (类 型 A) 还 是 与 某 个 名 字 的 邮件 服务 希 相 关联 (类 
AY MX). 
e 在 来 和 日 DNS 服务 器 的 回答 中 ， 回 答 区 域 包含 了 对 最 初 请 求 的 名 字 的 资源 记录 。 前 
面 讲 过 每 个 资源 记录 中 有 Type (如 A、NS、CNAME 和 MX) 字段 、Value 字段 和 
TTL 字段 。 在 回答 报 文 的 回答 区 域 中 可 以 包含 多 条 RR， 因 此 一 个 主机 名 能 够 有 多 
个 下 地 址 〈 例 如 ， 就 像 本 节 前 面 讨 论 的 元 余 Web IRI AF) - 
© 权威 区 域 包含 了 其 他 权威 服务 从 的 记录 . 
e 附加 区 域 包含 了 其 他 有 帮助 的 记录 。 例 如， 对 于 一 个 MX 请 求 的 回答 报 文 的 回答 
区 域 包含 了 一 条 资源 记录 ， 该 记录 提供 了 邮件 服务 硕 的 规范 主机 名 。 该 附加 区 域 
包含 一 个 类 型 A 记录 ， 该 记录 提供 了 用 于 该 邮件 服务 硕 的 规范 主机 名 的 IP 地址。 
你 愿意 从 正在 工作 的 主机 直接 回 某 些 DNS 服务 硕 发 送 一 个 DNS 查询 报 文 吗 ? 使 用 
nslookup 程序 (nslookup program) 能 够 容易 地 做 到 这 一 点 ， 对 于 多 数 Windows 和 UNIX 平 
A, nslookup 程序 是 可 用 的 。 例 如 ， 从 一 台 Windows 主机 打开 命令 提示 和 从 界面， 和 直接 键入 
“nslookup” 即 可 调用 该 nslookup 程序 。 在 测 JJH nslookup 后 ， 你 能 够 回 任 何 DNS 服务 着 CAR 
TLD 或 权威 ) 发 送 DNS 查询 。 在 接收 到 来 H DNS 服务 需 的 回答 后 ，nslookup 将 显示 包括 在 
该 回答 中 的 记录 (以 人 可 读 的 格式 ) 。 从 你 目 己 的 主机 运行 nslookup 还 有 一 种 方法 ， 即 访问 
公主 你 远程 应 用 nslookup 的 许多 Web 站 点 之 一 (在 一 个 搜索 引擎 中 键入 “nslookup” WHEY 
得 到 这 些 站 点 中 的 一 个 )。 本 章 最 后 的 DNS Wireshark 实验 将 使 你 更 为 详细 地 人 研究 DNS. 
2. 在 DNS 数据 库 中 插入 记录 
上 面 的 讨论 只 是 关注 如 何 从 DNS 数据 库 中 取 数 据 。 你 可 能 想 知 道 这 些 数据 最 初 是 起 
么 进入 数据 库 中 的 。 我 们 在 一 个 特定 的 例子 中 看 看 这 是 如 何 完 成 的 。 假 定 你 刚刚 创建 一 个 
称 为 网 络 乌 托 邦 (Network Utopia) 的 令 人 兴奋 的 新 创业 公司 。 你 必定 要 做 的 第 一 件 事 是 
在 注册 登记 机 构 注 册 域 名 networkutopia. com。 注 册 登 记 机 构 (registrar) 是 一 个 商业 实体 ， 
它 验 证 该 域名 的 唯一 性 ,将 该 域名 输入 DNS 数据 库 (如 下 面 所 讨论 的 那样 ) ， 对 提供 的 服 
务 收取 少量 费用 。199%9 年 前 ， 唯 一 的 注册 登记 机 构 是 Nework Solution， 它 独家 经 营 对 于 
com, net 和 org 域名 的 注册 。 但 是 现在 有 许多 注册 登记 机 构 葛 和 争 客户 ， 因 特 网 名 字 和 地 址 
分 配 机 构 (Internet Corporation for Assigned Names and Numbers, ICANN) 回 各 种 注册 登记 
机 构 授 权 。 在 http://www. internic. net 上 可 以 找到 授权 的 注册 登记 机 构 的 列表 。 
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当 你 回 某 些 注册 登记 机 构 注 册 域 名 networkutopia. com 时 ， 震 要 回 该 机 构 提 供 你 的 基本 
FAH HA a DNS 服务 郑 的 名 字 和 了 中 地 址 ， 假 定 该 名 宇和 IP 地 址 是 dns. networkutopia. com 


和 dns2. networkutopia. com 及 212. 212. 212. 1 和 212. 212.212.2。 对 这 两 个 权威 DNS 服务 大 
的 每 一 个 ， 该 注册 登记 机 构 确 保 将 一 个 类 型 NS 和 一 个 类 型 A isi A TLD com 服务 
fir PF HM EXT PHF networkutopia. com AY FEAR AURIA Ar, FATE IC ALR F 5 PY 2B ot 


源 记 录 捅 入 该 DNS 系统 中 : 

(networkutopia.com, dnsl.networkutopia.com, NS) 

(dnsl.networkutopia.com, 212.212.212.1, A) 

你 还 必须 确保 用 于 Web Ak 4% gf www. networkutopia. com 的 类 型 A 资源 记录 和 用 于 邮件 
Hie $$ At mail. networkutopia. com 的 类 型 MX 资源 记录 被 输入 你 的 权威 DNS 服务 需 中 。( 直到 
最 近 ， 每 个 DNS 服务 硕 中 的 内 容 都 是 静态 配置 的 ， 例 如 来 自 系 统管 理 员 创建 的 配置 文件 。 
最 近 ， 在 DNS 协议 中 添加 了 一 个 更 新 CUPDATE) 选项 ， 人 允许 通过 DNS 报 文 对 数据 库 中 
的 内 容 进 行动 态 添 加 或 者 删除 。LRFC 2136] 和 [RFC 3007] 定义 了 DNS 动态 更 新 -) 

一 旦 完成 所 有 这 些 步 骤 ， 人 们 将 能 够 访问 你 的 Web 站 点 ， 并 阿 你 公司 的 雇员 发 送 电 
邮件。 我 们 通过 验证 该 说 法 的 正确 性 来 总 结 DNS 的 讨论 。 这 种 验证 也 有 助 于 充实 我 们 

己 经 学 到 的 DNS 知识 。 假 定 在 澳大利亚 的 Alice 要 观看 www. networkutopia. com 的 Web 页 

i. 如 前 面 所 讨论 、 好 的 主机 将 首先 向 其 本 地 DNS AR ah KAR. PRAM SS Pe A 
由 联系 一 个 TLD com R448. (如 果 TLD com 服务 堪 的 地 址 没有 被 缓存 ， 该 本 地 DNS 服务 
织 也 将 必须 与 根 DNS 服务 器 相 联 系 。) 该 TLD 服务 器 包含 前 面 列 出 的 类 型 NS 和 类 型 A 资 
源 记 录 ， 因 为 注册 登记 机 构 将 这 些 资源 记录 捅 人 所 有 的 TLD com IK go 1K TLD com 服务 
ari] Alice 的 本 地 DNS 服务 大 发 送 一 个 回答 ， 该 回答 包含 了 这 两 条 资源 记录 。 该 本 地 DNS 
Nhe FF te WU fn] 212. 212. 212. 1 发 送 一 个 DNS 查询 ， 请 求 对 应 于 www. networkutopia. com 的 类 
型 A 记录 。 该 记录 提供 了 所 希望 的 Web IRA AeA) IP 地址 ， 如 212. 212.71.4， 本 地 DNS 服 
秀 玉 将 该 地 址 回 传 给 Alice 的 主机 。Alice 的 浏览 硕 此 时 能 够 问 主 机 212. 212. 71. 4 发 起 一 个 
TCP 连接 ， 并 在 该 连接 上 发 送 一 个 HTTP 请 求 。 当 一 个 人 在 网 上 冲浪 时 ， 有 比 满足 眼球 更 
多 的 事情 在 进行 ! 


=e E. > Moe EE ` a 了 roe Te i = ee FTS ER By a Sd =~ a r 
4 $ yp alc n E "ge E AE E A Sts e Be sete) Og a oe oe AS BAe og \ f Re 
S bh a i A Sah eae ee amy Sec > = 2: m sd Sy o ESTE aes eae Ws RK, hes PPOs eR a E oe au fF w 
SERS 4 SVC ae - OS sa a En Se Ske Pee a et oe 5 cede Pie Me = i a 


我 们 已 经 看 到 DNS 是 因特网 基础 设施 的 一 个 至 关 重 要 的 组 件 ， 对 于 包括 Web, w 
子 邮 件 等 的 许多 重要 的 服务 ， 没 有 它 都 不 能 正常 工作 。 因 此， 我 们 自然 要 问 ，DNS Aih 
被 怎样 攻击 呢 ? DNS 是 一 个 易 受 攻击 的 目标 吗 ? 它 是 将 会 被 淘汰 的 服务 吗 ? 大 多 数 因 特 
网 应 用 会 随同 它 一 起 无 法 工作 吗 ? 

想到 的 第 一 种 针对 DNS 服务 的 攻击 是 分 布 式 拒绝 服务 (DDS) 带宽 洪 泛 攻击 (A 
1.6 7). 例如 ， 某 攻击 者 能 够 试图 向 每 个 DNS 根 服 务 器 发 送 大 量 的 分 组 ， 使 得 大 多 
数 合法 DNS 请 求 得 不 到 回答 。 这 种 对 DNS 根 服务 器 的 DDoS 大 规模 攻击 实际 发 生 在 2002 
年 10 月 21 日 。 在 这 次 攻击 中 ， 该 攻击 者 利用 了 一 个 僵尸 网 络 向 13 个 DNS 根 服 务 器 中 
的 每 个 都 发 送 了 大 批 的 ICMP ping RX, (第 4 章 中 讨论 了 ICMP 报 文 。 此 时 ， 知 道 ICMP 
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分 组 是 特殊 类 型 的 IP 数据 报 就 可 以 了 。) 幸运 的 是 ， 这 种 大 规模 攻击 所 带 来 的 损害 很 
小 ， 对 用 户 的 因特网 体验 几乎 没有 或 根本 没有 影响 。 攻 击 者 的 确 成 功 地 将 大 量 的 分 组 指 
向 了 根 服务 器 ， 但 许多 DNS 根 服务 器 受到 了 分 组 过 滤器 的 保护 ， 配 置 的 分 组 过 滤器 阻 
挡 了 所 有 指向 根 服 务 器 的 ICMP ping 报 文 。 这 些 被 保护 的 服务 器 因此 未 受伤 害 并 且 与 平 
常 一 样 发 挥 着 作用 。 此外， 大 多 数 本 地 DNS 服务 器 缓存 了 顶级 域名 服务 器 的 IP 地 址 ， 
使 得 这 些 请 求 过 程 通常 绕 过 了 DNS 根 服务 器 。 

对 DNS 的 潜在 更 为 有 效 的 DDoS 攻击 将 是 向 顶级 域名 服务 器 (例如 向 所 有 处 理 . com 
域 的 顶级 域名 服务 器 ) 发 送 大 量 的 DNS 请 求 。 过 滤 指 向 DNS 服务 器 的 DNS 请 求 将 更 为 
困难 ， 并 且 顶 级 域名 服务 器 不 像 根 服务 器 那样 容声 绕 过 。 但 是 这 种 攻击 的 严重 性 通过 本 
地 DNS 服务 器 中 的 缓存 技术 可 将 部 分 地 被 缓解 。 

DNS 能 够 潜在 地 以 其 他 方式 被 攻击 。 在 中 间 人 攻击 中 ， 攻 击 者 截获 来 自主 机 的 请 求 
并 返回 伪造 的 回答 。 在 DNS 毒害 攻击 中 ， 攻 击 者 向 一 台 DNS 服务 器 发 送 伪造 的 回答 ， 
诱 使 服务 器 在 它 的 缓存 中 接收 伪造 的 记录 -这些 攻击 中 的 任 一 种 ， 都 能 够 将 满怀 信任 的 
Web 用 户 重 定向 到 攻击 者 的 Web 站 点 然而， 这 些 攻 击 难以 实现 ， 因 为 它们 要 求 截获 
分 组 或 扼 制 住 服务 器 [Skoudis 2006 | . 

另 一 种 重要 的 DNS 攻击 本 质 上 并 不 是 一 种 对 DNS 服务 的 攻击 ， 而 是 充分 利用 DNS 
基础 设施 来 对 目标 主机 发 起 DDoS 攻击 (例如 ， 你 所 在 大 学 的 邮件 服务 器 )。 在 这 种 攻 
击 中 ， 攻 击 者 向 许多 权威 DNS 服务 器 发 送 DNS 请 求 ， 每 个 请 求 具 有 目标 主机 的 假冒 源 
地 址 ， 这 些 DNS 服务 器 则 直接 向 目标 主机 发 送 它 们 的 回答 。 如 果 这 些 请 求 能 够 精心 制 
作成 下 述 方式 的 话 ， 即 响应 比 请 求 ( 字 节 数 ) 大 得 多 (所谓 放 大 )， 则 攻击 者 不 必 自 行 
产生 大 量 的 流量 就 有 可 能 淹没 目标 主机 。 这 种 利用 DNS 的 反射 攻击 至 今 为 止 只 取得 了 
有 限 的 成 功 | Mirkovic 2005 | .. 

总 而 言 之 ，DNS 自身 已 经 显示 了 对 抗 攻击 的 令 人 惊讶 的 健壮 性 。 至 今 为 止 ， 还 没有 
一 个 攻击 已 经 成 功 地 妨碍 了 DNS 服务 。 已 经 有 了 成 功 的 反射 攻击 ; 然而 ， 通 过 适当 地 
配置 DNS 服务 器 ， 能 够 处 理 (和 正在 处 理 ) 这 些 攻击 。 


2.6 P2P 应 用 


在 目前 为 止 本 章 中 描述 的 应 用 (包括 Web、 电 子 邮件 和 DNS) 都 采用 了 客户 -服务 器 
体系 结构 ， 极 大 地 依赖 于 总 是 打开 的 基础 设施 服务 器 。2. 1.1 节 讲 过 ,使 用 P2P 体系 结 
构 ， 对 总 是 打开 的 基础 设施 服务 器 有 最 小 的 〈 或 者 没有 ) He. SHAR, MOTB) KEE 
的 主机 ( 称 为 对 等 方 ) 彼此 直接 通信 。 这 些 对 等 方 并 不 为 服务 提供 商 所 拥有 ， 而 是 受用 户 
控制 的 桌面 计算 机 和 膝 上 计算 机 ， 

在 本 节 中 我 们 将 研究 两 种 不 同 的 特别 适合 于 P2P 设计 的 应 用 。 第 一 种 应 用 是 文件 分 
发 ， 其 中 应 用 程序 从 单个 源 向 大 量 的 对 等 方 分 发 一 个 文件 。 文 件 分 发 是 开始 研究 P2P 的 良 
好 起 点 ， 因 为 它 清晰 地 揭示 了 P2P 体系 结构 的 自 扩展 性 。 作 为 文件 分 发 的 一 个 特定 的 例 
子 ， 我 们 将 描述 流行 的 BitTorrent 协议 。 我 们 将 研究 的 第 二 种 PP 应 用 是 分 布 在 大 型 对 等 
方 社区 中 的 数据 库 。 对 于 这 个 应 用 ， 我 们 将 探讨 分 布 式 散 列 表 ( Distributed Hash Table, 
DHT) 的 概念 。 
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2.6.1 P2P 文件 分 发 

我 们 通过 考虑 一 个 非常 目 然 的 应 用 来 开始 涉足 PPP， 这 种 应 用 即 从 单一 服务 谷 问 大 量 
主机 ( 称 为 对 等 方 ) 分 发 一 个 大 文件 。 该 文件 也 许 是 一 个 新 版 的 Linux 操作 系统 ， 对 于 现 
有 操作 系统 或 应 用 程序 的 一 个 软件 补丁 ， 一 个 MP3 音乐 文件 .或 一 个 MPEG 视频 文件 
在 客户 -服务 需 文 件 分 发 中 ， 该 服务 硕 必 须 回 每 个 对 等 方 发 送 该 文件 的 一 个 副本 ， 即 服务 
做 承受 了 极 大 的 负担 ， 并 且 消 耗 了 大 量 的 服务 器 带宽。 在 P2P 文件 分 发 中 ， 每 个 对 等 方 能 
够 重新 分 发 它 所 有 的 该 文件 的 任何 部 分 ， 从 而 在 分 发 过 程 中 协助 该 服务 右 . 到 2012 年 止 ， 
最 为 流行 的 P2P 文件 共享 协议 是 BitTorrent. 该 应 用 程序 最 初 由 Bram Cohen OFA, ME 
有 许多 不 同 的 独立 上 且 符 合 BitTorrent 协议 的 BitTorrent 客户 ， 束 像 有 许多 符合 HTTP 协议 的 
Web 训 览 需 客 户 一 样 。 在 下 面 的 小 节 中 ,我 们 首先 研究 在 文件 分 发 环境 中 的 P2P 体系 结构 
的 自 扩展 性 。 然 后 我 们 更 为 详细 地 描述 BitTorrent， 突 出 它 的 最 为 重要 的 特性 和 特色 . 

1. P2P 体系 结构 的 扩展 性 

为 了 将 客户 -服务 硕 体 系 结构 与 P2P AR AZARAE TT ee, GR P2P 的 内 在 日 扩展 性 ， 
我 们 现在 考虑 一 个 用 于 两 种 体系 结构 类 型 的 简单 定量 模型 ， 将 一 个 文件 分 发 给 一 个 固定 集 
合 ， 如 图 2-24 所 示 ， 服 务 右 和 对 等 方 使 用 接 人 链 路 与 因特网 相连 。 其 中 Ze ARH Arik 
ABERRI ERRER, u 表示 第 i 对 等 方 接 入 链 路 的 上 载 速率 ，d, 表示 了 第 i 对 等 方 接 入 链 
路 的 下 载 速 率 ， 还 用 下 表示 被 分 发 的 文件 长度 (以 比特 计 ),， N 表示 要 获得 的 该 文件 副本 
的 对 等 方 的 数量 。 分 发 时 间 (distribution time) 是 所 有 N 个 对 等 方 得 到 该 文件 的 副本 所 圩 
要 的 时 间 :. 在 下 面 分 析 分 发 时 间 的 过 程 中 ， 我 们 对 客户 -服务 融和 P2P 体系 结构 做 了 简化 
( 并 且 一 般 是 准确 的 [Akella 2003]) 的 假设 ， 即 因特网 核心 有 具有 足够 的 市 党， 这 意味 着 所 
有 瓶颈 都 在 网 络 接 人 链 路 。 我 们 还 假设 服务 硕 和 客户 没有 参与 任何 其 他 网 络 应 用 ， 因 此 它 
们 的 所 有 上 传 和 下 载 访问 市 宽 能 被 全 部 用 于 分 发 该 文件 ， 





图 2-24 文件 分 发 问题 的 示例 图 
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我 们 首先 来 确定 对 于 客户 - 服务 需 体 系 结构 的 分 发 时 间 ， 我 们 将 其 表示 为 D.. LE 
户 -服务 天 体系 结构 中 . 没有 对 等 方 参与 来 帮助 分 发 文件 。 我 们 做 下 列 观察 : 
o 服务 希 必 须 问 Y 个 对 等 方 的 每 个 传输 该 文件 的 一 个 副本 。 因 此 该 服务 吾 必 须 传 输 
NF 比特 : 因为 该 服务 大 的 上 载 速 率 是 凡 ， 分 发 该 文件 的 时 间 必 定 是 至 少 为 
NAA 
。 令 di 表示 具 有 最 小 下 载 速率 的 对 等 方 的 下 载 速 率 ,， BI duin =min}d,, dp, s+, dy} o 
具有 最 小 下 载 速 率 的 对 等 方 不 可 能 在 少 于 FVdiii, 秒 时 间 内 获得 该 文件 的 所 有 FF 比 
特 。 因 此 最 小 分 发 时 间 至 少 为 F/d ie 
将 这 两 个 观察 放 在 一 起 ， 我 们 得 到 
NF F 
D. = max {og | 
该 式 提供 了 对 于 客户 -服务 带 体 系 结构 的 最 小 分 发 时 间 的 下 界 。 在 课 后 习题 中 将 请 你 
给 出 服务 需 能 够 调度 它 的 传输 以 便 实 际 取得 该 下 界 的 方法 。 因 此 我 们 取 上 面 提供 的 这 个 下 
界 作为 实际 发 送 时 间 ， 即 
NF F | 
D s many yt (2-1) 


我 们 从 式 (2-1) 看 到 ， 对 足够 大 的 WN， 客户 -服务 器 分 发 时 间 由 NFAu. 确定 。 所 以 ， 
该 分 发 时 间 随 着 对 等 方 N 的 数量 线性 地 增加 。 因 此 举例 来 说 ， 如 果 从 某 星期 到 下 星期 对 等 
方 的 数量 从 1000 增加 了 1000 倍 ， 到 了 100 万 ,将 该 文件 分 发 到 所 有 对 等 方 所 需要 的 时 间 
就 要 增加 1000 售 。 

我 们 现在 来 对 P2P 体系 结构 进行 简单 的 分 析 ， 其 中 每 个 对 等 方 能 够 帮助 服务 大 分 发 该 
文件 。 特 别 是 ， 当 一 个 对 等 方 接收 到 某 些 文件 数据 ， 它 能 够 使 用 自己 的 上 载 能 力 重 新 将 数 
据 分 发 给 其 他 对 等 方 。 计 算 P2P 体系 结构 的 分 发 时 间 在 某 种 程度 上 比 计算 客户 FR aS aS 
系 结 构 的 更 为 复杂 ， 因 为 分 发 时 间 取 决 于 每 个 对 等 方 如 何 回 其 他 对 等 方 分 发 该 文件 的 各 个 
部 分 。 无 论 如 何 ， 能 够 得 到 对 该 最 小 分 发 时 间 的 一 个 简单 表示 式 | Kumar 2006], 至 此 ， 
我 们 先 做 下 列 观察 : 

© 在 分 发 的 开始 ， 只 有 服务 器 具有 文件 。 为 了 使 社区 的 这 些 对 等 方 得 到 该 文件 ， 该 

服务 器 必须 经 其 接 入 链 路 至 少 发 送 该 文件 的 每 个 比特 一 次 。 因 此 ， 最 小 分 发 时 间 
至 少 是 Rh/u,。( 与 客户 - 服务 天 方案 不 同 ， 由 服务 需 发 送 过 一 次 的 比特 可 能 不 必 
由 该 服务 需 再 次 发 送 ， 因 为 对 等 方 在 它们 之 间 可 以 重新 分 发 这 些 比特 - ) 

© 与 客户 -服务 器 体系 结构 相同 ， 具 有 最 低下 载 速率 的 对 等 方 不 能 够 以 小 于 Fd nin 
秒 的 分 发 时 间 获 得 所 有 比特。 因此 最 小 分 发 时 间 至 少 为 F/d . 

。 最 后 ， 观 察 到 系统 整体 的 总 上 和 载 能 力 等 于 服务 器 的 上 载 速率 加 上 每 个 单独 的 对 等 
方 的 上 载 速 率 ， 即 ug =u +u +… tuys. 系统 必须 回 这 NN 个 对 等 方 的 每 个 交付 
(ER) F 比特 ， 因 此 总 共 交 付 NF 比特。 这 不 能 以 快 于 uw 的 速率 完成 。 因 此 ， 
最 小 的 分 发 时 间 也 至 少 是 NF/(u, +u tees +uy)。 

将 这 三 个 观察 放 在 一 起 ， 我 们 获得 了 对 P2P 的 最 小 分 发 时 间 ， 表 示 为 Dor: 

F AN 
FJ | (2-2) 


3 N 
min 
Wu. + py U, 
i=] 


F 
Doy many 
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式 (2-2) 提供 了 对 于 P2P 体系 结构 的 最 小 分 发 时 间 的 下 界 . 这 说 明 ， 如 采 我 们 认为 
一 旦 每 个 对 等 方 接收 到 一 个 比特 就 能 够 重 分 发 一 个 比特 的 话 ， 则 存在 一 个 重新 分 发 方案 能 
实际 取得 这 种 下 界 [Kumar 2006]. (我 们 将 在 课 后 习题 中 证 明 该 结果 的 一 种 特 情形 .) 实 
际 上 ， 被 分 发 的 是 文件 块 而 不 是 一 个 个 比特 . 式 (2-2) 能 够 作为 实际 最 小 分 发 时 间 的 很 
好 近似 因此 ， 我 们 取 由 式 (2-2) 提供 的 下 界 作 为 实际 的 最 小 分 发 和 时间， 有 即 





要 = max F 9 * si 做 | 3 
u, Benin (<-- ) 
u + Yu 


图 2-25 比较 了 客户 -IRI AA P2P 体系 结构 的 最 小 分 发 时 间 ， 其 中 假定 有 所有 的 对 等 
方 具有 相同 的 上 载 速率 uu. 在 图 2-25 中 ,我 们 已 经 设置 了 Eu = 1 小 时 ,=10u, dun >u,- 
因此 ， 在 一 个 小 时 中 一 个 对 等 方 能 够 传输 整个 文件 ， 该 服务 顶 的 传输 速率 是 对 等 方 上 载 速 
率 的 10 倍 ， 并 且 (为 了 简化 起 见 ) 对 等 方 的 下 载 速 率 被 放置 得 足够 大 ， 使 之 不 会 产生 影 
Me, FKP IAP 2-25 中 看 到 ， 对 于 客户 -服务 融 体 系 结 钧 ， 随 着 对 等 方 数量 的 增加 ， 分 发 
a 线性 增长 并 且 没 有 界 。 然而， 对 于 P2P 体系 结构 ， 最 a 不 仅 总 是 小 于 客 

户 -服务 需 体 系 结构 的 分 发 时 间 ， 并 且 对 于 任意 ep 总 是 小 于 1 了 小时。 A 
此 ， 具 有 P2P 体系 结构 的 应 用 程序 能 够 是 目 扩 尾 的 . 这 种 扩 eta AN 对 等 方 除 
了 是 比特 的 消费 者 外 还 是 它们 的 重新 分 发 者 . 
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客户 -服务 器 


最 小 分 发 时 间 


4] 2-25 P2P 和 和 客户 -服务 髓 体系 结构 的 分 发 时 间 


2. BitTorrent 


BitTorrent 是 一 种 用 于 文件 分 发 的 流行 PPP 协议 [Chao 2011 |. 用 BitTorrent 的 术语 来 
讲 ， 参 与 一 个 特定 文件 分 发 的 所 有 对 等 方 的 集合 被 称 为 一 个 洪流 (torrent ) ， 在 一 个 洪流 
中 的 对 等 方 彼此 下 载 等 长 度 的 文件 块 (chunk) ， 典 型 的 块 长 度 为 236KB。 当 一 个 对 等 方 首 
次 加 入 一 个 洪流 时 ， 它 没有 块 。 随 着 时 间 的 流逝 ， 它 累积 了 越 来 越 多 的 块 。， 当 它 下 载 块 
时 ， 也 为 其 他 对 等 方 上 和 载 了 多 个 块 。 一 旦 某 对 等 方 获得 了 整个 文件 ， 它 也 许 (日 私 地 ) 离 
开 洪 流 , 或 (大公无私 地 ) 贸 在 该 洪流 中 并 继续 向 其 他 对 等 方 上 载 块 同时 ， 任 何 对 等 方 
可 能 在 任何 时 候 仅 具有 块 的 子 集 就 离开 该 洪流 ， 并 在 以 后 重新 加 入 该 洪流 中 ， 

我 们 现在 更 为 仔细 地 观察 BitTorrent 运行 的 过 程 。 因为 BitTorrent 是 一 个 相当 复 傈 的 协 
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LAFER LHE E e EAL il, pareou 这 将 使 得 我 们 能 够 通过 树 
aa 每 个 洪流 具有 一 个 基础 设施 结 点 ， 称 为 追踪 器 (tracker)。 当 一 个 对 等 方 加 入 
EAT, “Elbe aE A, FEDELE ANE Brar EDE ZEP ARII t, 
JB or arRo ES 5 AEE PRES o 一 个 给 定 的 洪流 可 能 在 任何 时 刻 具 有 数 以 百 计 或 数 
以 干 计 的 对 等 方 

如 各 2-26 所 示 ， 当 一 个 新 的 对 等 方 Alice 加 入 该 洪流 时 ， 追 踪 融 随机 地 从 参与 对 等 方 
的 集合 中 选择 对 等 方 的 一 个 子 集 (为 了 具体 起 见 ， 设 有 50 个 对 等 方 ) ， 并 将 这 SO 个 对 等 
方 的 趾 地 址 发 送 给 Alice, Alice 持 有 对 等 方 的 这 张 列 表 ， 试 图 与 该 列表 上 的 所 有 对 等 方 创 
建 并 行 的 TCP 连接 。 我们 称 所 有 这 样 与 Alice 成 功 地 创建 一 个 TCP 连接 的 对 等 方 为 “ 
vgs (在 图 2-26 中 ，Alice EaR TMA = PAU ST A, a AELA 

BEZ SS Ta] A aE, HE SE Py HE EE nn] RE SI cates (最 初 SO 4 以 外 的 ) 
人 Alice 创建 TCP 连接 ， 因 此 一 个 对 等 方 的 邻近 对 等 方 将 随时 间 而 波动 。 

i Bi aie 对 E 





获得 对 等 方 ， 
的 列表 





[x] 2-26 H BitTorrent 分 发 文件 


在 任何 给 定 的 时 间 ， 每 个 对 等 方 将 具有 来 自 该 文件 的 块 子 集 ， 并 且 不 同 的 对 等 方 具有 
不 同 的 子 集 。Alice 周期 性 地 (经 TCP 连接) 询问 每 个 邻近 对 等 方 它们 所 具有 的 块 列 表 
如 果 Alice 具有 上 个 不 同 的 邻居 ， 她 将 获得 工 个 块 列 表 。 有 了 这 个 信息 ，Alice 将 对 她 当前 
还 没有 的 块 发 出 请 求 ( 仍 通过 TCP 连接 )， 

内 此 在 任何 给 定 的 时 刻 ，Alice 将 具有 块 的 子 集 并 知道 它 的 邻居 具有 哪些 块 ， 利用 这 
些 信 息 ，Alice 将 作出 两 个 重要 决定 。 第 一 ， 她 应 当 从 她 的 邻居 请 求 哪些 块 呢 ? 第 二 ， 她 
应 当 癌 哪些 向 她 请 求 块 的 邻居 发 送 ? 在 决定 请 求 哪些 块 的 过 程 中 ，Alice 使 用 一 种 称 为 最 
稀缺 优先 (rarest first) 的 技术 。 这 种 技术 的 思路 是 ， 针 对 她 没有 的 块 在 她 的 邻居 中 决定 最 
黎 瑞 的 块 〈 最 称 缺 的 块 就 是 那些 在 她 的 邻居 中 副本 数量 最 少 的 块 ) ， 并 首先 请 求 那 些 最 称 
缺 的 块 ， 这 样 ， 最 稀缺 块 得 到 更 为 迅速 的 重新 分 发 ， 其 目标 是 (大致 地 ) 均衡 每 个 块 在 潜 
流 中 的 副本 数量 ， 
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为 了 决定 她 啊 应 哪个 请 求 ，BitTorrent 使 用 了 一 种 机 灵 的 对 换算 法 。 其 基本 想法 是 ， 
Alice 根据 当前 能 够 以 最 高 速率 问 她 提供 数据 的 邻 届 ， 给 出 其 优先 权 。 特 别 是 ，Alice 对 于 
她 的 每 个 邻居 都 持续 地 测量 接收 到 比特 的 速率 ， 并 确定 以 最 高 速率 流入 的 4 个 邻 届 。 每 过 
10 秒 ， 她 重新 计算 该 速率 并 可 能 修改 这 4 个 对 等 方 的 集合 . 用 BitTorrent 术语 来 说 ， 这 4 
个 对 等 方 被 称 为 疏通 (unchoked) 。 重要 的 是 ， 每 过 30 秒 ， 她 也 要 随机 地 选择 另外 一 个 邻 
居 并 向 其 发 送 块 。 我 们 将 这 个 被 随机 选择 的 对 等 方 称 为 Bob。 因 为 Alice 正在 向 Bob 发 送 
数据 ， 她 可 能 成 为 Bob 前 4 位 上 载 者 之 一 ， 这 样 的 话 Bob 将 开始 癌 Alice RIK BA WER 
Bob [nj Alice 发 送 效 据 的 速率 足够 局 ，Bob 接 下 来 也 能 成 为 Alice 的 前 4 位 上 载 者 。 换 言 之 ， 
每 过 30 秒 Alice 将 随机 地 选择 一 名 新 的 对 换 伴侣 并 开始 与 那 位 伴侣 进行 对 换 。 如 本 这 两 名 
对 等 方 都 满足 此 对 换 ， 它 们 将 对 方 放 入 其 前 4 位 列表 中 并 继续 与 对 方 进行 对 换 ， 下 到 该 对 
等 方 之 一 发 现 了 一 个 更 好 的 伴侣 为 止 。 这 种 效果 是 对 等 方 能 够 以 趋 问 于 找到 彼此 的 协调 的 
速率 上 载 。 随 机 选择 邻 届 也 允许 新 的 对 等 方 得 到 块 ， 因 此 它们 能 够 具有 对 换 的 东西 。 除 了 
这 5 个 对 等 方 (“前 ”4 个 对 等 方 和 一 个 试探 的 对 等 方 ) 的 所 有 其 他 相 邻 对 等 方 均 被 “ 阴 
HE", BEM I AHEM Alice 接收 到 任何 块 。BitTorrent 有 一 些 有 趣 的 机 制 没有 在 这 里 讨论 ， 
包括 片 ( 小 块 )、 流 水 线 、 随 机 优先 选择 、 残 局 模型 和 反 仍 慢 | Cohen 2003 | - 

刚刚 描述 的 关于 交换 的 激励 机 制 经 第 被 称 为 “一 报 还 一 报 ”(tit-for-tat) [Cohen 2003]. 
己 证 实 这 种 激励 方案 能 被 回避 | Liogkas 2006; Locher 2006; Piatek 2007 ] 。 无 论 如 何 ， 
BitTorrent “生态 系统 ”取得 了 广泛 成 功 ， 数 以 百 万 计 的 并 发 对 等 方 在 数 十 万 条 洪流 中 积极 
地 共享 文件 。 如 果 BitTorrent 被 设计 为 不 采用 一 报 还 一 报 (或 一 种 变种 ) ， 然 而 在 别 的 方面 
寺 完 全 相同 的 协议 ，BitTorrent 现在 将 很 可 能 不 复 存 在 了 ， 因 为 大 多 数 有 用户 将 成 为 搭便 车 
者 了 | Sarouiu 2002 | 。 

[ Guo 2005; Piatek 2007] 提出 了 BitTorrent 协议 的 有 趣 变种 。 此 外 ,许多 P2P 直播 流 
式 应 用 如 PPLive 和 PPstream 从 BitTorrent 中 获得 了 灵感 | Hei 2007 |. 


2.6.2 分 布 式 散 列 表 


(EAI, RIKA IEE P2P 网 络 中 怎样 实现 一 个 简单 的 数据 库 。 我 们 先 从 描述 这 种 
简单 数据 库 的 集中 式 版 本 开始 ， 该 数据 库 只 包含 (E, E) 对 。 例如: 键 可 以 是 社会 保险 
号 ， 值 可 以 是 相应 的 人 名 ; 在 这 种 情况 下 ， 键 - 值 对 的 例子 如 (156-45-7081, Johnny 
Wu) 。 或 者 键 可 以 是 目录 名 (人 例如， 电影 、 唱 片 和 软件 的 名 字 ) ， 值 可 以 是 存储 内 容 的 卫 
地 址 ; 在 这 种 情况 下 ， 键 - 值 对 的 例子 如 (Led Zppelin IV, 128. 187. 123.38). 我们 用 键 
来 查询 数据 库 。 如 果 在 该 数据 库 中 有 一 个 或 多 个 键 - 值 对 匹配 该 查询 键 ， 该 数据 库 就 返回 
相应 的 值 。 例 如 ， 如 果 该 数据 库存 储 了 社会 保险 号 和 它们 对 应 的 人 名 ， 我 们 能 够 用 特定 的 
社会 保险 号 查询 ， 该 数据 库 就 返回 具有 那个 社会 保险 号 的 人 的 名 字 。 或 者 ， 如 果 数 据 库存 
储 了 目录 名 及 其 相应 的 IP 地 址 ， 我 们 能 够 用 特定 的 目录 名 查询 ， 该 数据 库 返 回 存 储 该 特 
定 内 容 的 IP 地址。 

构建 这 样 一 个 数据 库 直 接 采 用 客户 -服务 占 体 系 结构 ， 以 在 一 个 中 心服 务 各 中 存储 所 
有 【( 键 , fA) 对 。 因 此 在 本 节 中 ， 我 们 将 考虑 构建 这 种 数据 库 的 一 个 分 布 式 、P2P 的 版 
本 ， 在 数 以 百 万 计 的 对 等 方 上 存储 ( 键 , 值 ) 对 。 在 该 PP 系统 中 ， 每 个 对 等 方 将 保持 
( 键 ， 值 ) 对 仅 占 总 体 的 一 个 小 子 集 。 我 们 将 允许 任何 对 等 方 用 一 个 特别 的 键 来 查询 该 分 
布 式 数据 库 。 分 布 式 数据 库 则 将 定位 拥有 该 相应 〈 键 ， 值 ) 对 的 对 等 方 ， 然 后 回 查 询 的 对 
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等 方 返回 该 ( 键 , 值 ) 对 。 任何 对 等 方 也 将 允许 在 数据 库 中 搬 人 新 键 - 值 对 。 这 样 一 种 分 
布 式 数据 库 被 称 为 分 布 式 散 列 表 (Distributed Hash Table, DHT) . 

在 描述 如 何 创 建 一 个 DHT 的 方法 之 前 ， 我 们 首先 描述 在 P2P 文件 共享 环境 中 DHT HR 
务 的 一 个 特定 例子 。 在 这 种 情况 下 ， 键 是 一 个 目录 名 ， 而 值 是 具有 该 目录 副本 的 对 等 方 IP 
地 址 。 因 此 ， 如 果 Bob 和 Charlie 都 有 具有 一 个 最 新 Linux 分 发 副本 的 话 ， 则 DHT 数据 库 将 
包括 下 列 两 个 键 - 值 对 : (Linux，IPs,) 和 (Linux, IPQ). 更 为 具体 地 说 ， 因 为 DHT 
数据 库 分 布 在 一 些 对 每 方 上 ， 所 以 某 些 对 等 方 如 Dave XTE “Linux” Aa, HEKRA 
相应 的 键 - 值 对 。 现 在 假设 Alice 要 获得 Linux 的 一 个 副本 。 显 然 ， 她 在 能 够 开始 下 载 之 
六 ， 苑 再 要 知道 哪个 对 等 方 拥有 Linux 的 副本 。 为 此 ， 她 用 “Linux” 作 为 键 来 查询 DHT 
该 DHT 则 确定 对 等 方 Dave 负责 键 “Linux”。DHT 则 联系 对 等 方 Dave, M Dave 处 获得 
fe - {AX (Linux, IP,,,) 和 (Linux, Peann), B ENEH Alice, Alice 则 能 从 卫 ， 
或 JP .处 下 载 最 新 Linux 分 发 

现在 我 们 返回 到 为 通用 键 - 值 对 设计 一 个 DHT 这 个 一 般 性 的 问题 上 。 构 建 DHT 的 一 
种 幼稚 的 方法 是 跨越 所 有 对 等 方 随机 地 散布 E, 1E) 对 ， 让 每 个 对 等 方 维护 一 个 所 有 参 
与 对 等 方 的 列表 。 在 该 设计 中 ,查询 的 对 等 方 回 所 有 其 他 对 等 方 发 送 它 的 查询 ， 并 且 包 含 
与 键 匹 配 的 〈 键 ， 伍 ) 对 的 对 等 方 能 够 用 它们 匹配 的 对 进行 啊 应 。 当 然 ， 这 样 的 方法 完全 
无 扩展 性 ， 因 为 它 将 要 求 每 个 对 等 方 不 仅 知道 所 有 其 他 对 等 方 (这 样 的 对 等 方 可 能 数 以 百 
万 计 !) ， 而 且 更 糟 的 是 ， 要 加 所 有 对 等 方 发 送 一 个 查询 。 

我 们 现在 摘 述 设计 DAT 的 一 种 精确 有 效 的 方法 。 为 此 ， 我 们 现 为 每 个 对 等 方 分配 一 
个 怀 识 待 ， 其 中 每 个 标识 符 是 一 个 [0, 2" -1) 范围 内 的 整数 ，n 取 某 些 固定 的 值 。 值 得 
注意 的 是 这 样 的 标识 符 能 够 由 一 个 半 比 特 表 示 法 来 表示 。 我 们 也 要 求 每 个 键 是 同一 范围 内 
的 一 个 整数 。 敏 锐 的 读者 也 许 已 经 观察 到 刚才 描述 的 键 的 例子 (社会 保险 号 和 目录 名 ) 并 
非 是 整数 。 为 在 这 些 键 范围 外 生成 整数 ,我们 将 使 用 散 列 孔 数 把 每 个 键 (如 社会 保险 号 
映射 为 (0, 2"-1] 旋 围 内 的 一 个 整数 。 散 列 孔 数 是 一 种 多 对 一 的 阴 数 ， 使 两 个 不 同 的 输 
入 能 够 具有 相同 的 输出 (相同 的 整数 ), 但 是 具有 相同 输出 的 似 然 性 极 低 。 (不 熟悉 散 列 
哨 数 的 读者 可 以 看 一 下 第 7 草 ， 其 中 更 为 细致 地 讨论 了 散 列 函数 .) 假定 系统 中 的 所 有 对 
等 方 可 以 使 用 散 列 男 数 。 因 此 ， 当 我 们 提 及 “ 键 ”， 指 的 是 初始 键 的 散 列 值 。 因 此 ， 假 如 
初始 键 是 “Led Zppelin IV”, 在 DHT 中 使 用 的 键 将 是 等 于 “Led Zppelin IV” 散 列 值 的 整 
效 。 如 你 猜测 的 那样 ， 这 就 是 “ 散 列 ”被 用 于 术语 “分 布 式 散 列 表 ” 中 的 理由 。 

现在 我 们 来 考虑 在 DHT 中 存储 E, (E) 对 的 问题 。 此 时 的 中 心 问题 是 定义 为 对 等 
方 分 配 键 的 规则 。 给 定 每 个 对 等 方 具 有 一 个 整数 标识 符 ， 每 个 键 也 是 一 个 位 于 相同 范围 的 
整数 ， 一 种 当然 的 方法 是 为 其 标识 符 最 邻近 该 键 的 对 等 方 分 配 一 个 〈 键 ， 值 ) 对 。 为 实现 
这 样 的 方案 ， 我 们 将 需要 定义 “最 邻近 ”的 含义 。 为 了 方便 起 见 ， 我 们 将 最 邻近 对 等 方 定 
义 为 键 的 最 邻近 后 继 。 为 了 加 深 理 解 ， 我 们 来 看 一 个 特定 的 例子 。 假 设 n=4， 使 所 有 对 等 
方 和 键 标 识 符 部 位 于 [0, 15] 范围 内 。 进 一 步 假 定 在 该 系统 中 有 8 个 对 等 方 ， 它 们 的 标 
识 符 分 别 为 1!1、3、4、5、8、10、12 AIS. 假定 要 在 这 8 个 对 等 方 之 一 上 存储 CRE, 1) 
对 (11，jJohnny Wu)。 但 是 放 在 哪个 对 等 方 上 呢 ? 使 用 我 们 定义 的 最 邻近 规则 ， 因 为 对 等 
方 12 是 键 11 最 邻近 的 后 继 ， 因 此 我 们 将 (11, Johnny Wu) 存储 在 对 等 方 12 K [为 了 
完成 我 们 的 “最 邻近 ”定义 ， 说 明 如 下 : 如 果 该 键 恰好 等 于 这 些 对 等 方 标识 符 之 一 ， 我 们 
在 匹配 的 对 等 方 中 存 储 ( 键 ， 值 ) 对 ; 并 且 如 果 该 键 大 于 所 有 对 等 方 标识 符 ， 我 们 使 用 模 
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2" 规则， 在 具有 最 小 标识 符 的 对 等 方 中 存 储 ( 键 ， 值 ) J 

此 时 假定 某 对 等 方 Alice 要 将 一 个 (AE, 值 ) 对 插入 DHT. 从 概念 上 讲 ， 这 二 直接 

: 她 站 先 确 定 标识 特 最 邻近 该 键 的 对 等 方 ; 然后 她 问 那 个 对 等 方 发 送 一 个 报 文 ， 指示 它 
ca (HE, fH) 对 。 但 是 Alice 怎样 确定 最 邻近 该 键 的 对 等 方 呢 7 如 果 Alice 要 联系 系 
统 中 所 有 对 等 方 OMB ID 和 相应 的 IP 地 址 )， 她 能 够 在 本 地 确定 最 邻近 对 等 方 ， 但 是 
这 样 的 方法 要 求 每 个 对 等 方 联系 在 该 DHT 中 的 所 有 其 他 对 等 方 ， 而 这 对 于 有 具有 数 以 百 万 
计 对 等 方 的 大 规模 系统 而 言 ， 是 完全 不 现实 的 。 

1. 环形 DHT 

为 了 处 理 规 模 的 问题 ， 我 们 现在 考虑 将 对 等 方 组 织 为 一 个 环 - 在 这 种 环形 设置 中 ， 每 
个 对 等 方 仅 与 它 的 直接 后 继 和 直接 前 任 联系 (FR 2"). ER 2-27a 中 显示 了 这 种 环 的 一 个 
例子 。 在 该 例 中 ,，n 仍 取 为 4， 有 与 前 例 同样 的 8 个 对 等 方 。 每 个 对 等 方 仅 知道 它 的 直接 
后 继 和 直接 前 任 ， 例 如 ， 对 等 方 5 知道 对 等 方 8 和 4 的 IP 地 址 和 标识 符 ， 但 不 必 知 道 在 该 
DHT 中 任何 其 他 对 等 方 的 情况 。 对 等 方 的 这 种 环形 设置 是 覆盖 网 络 的 一 个 特殊 情况 ， 在 一 
个 绑 盖 网 络 中 ， 对 等 方形 成 了 一 个 抽象 的 逻辑 网 ， 该 网 存在 于 由 物理 链 路 、 路 由 融和 主机 
组 成 的 “底层 ”计算 机 网 络 之 上 ， 在 覆盖 网 络 ge ee 而 仅 是 对 等 方 对 之 
加 的 虚拟 联络 。 在 网 2-27a 所 示 的 窗 盖 网 络 中 ， 有 8 个 对 等 方 和 8 条 敌 盖 链 路 ; 在 
图 2-27b 所 示 的 柳 盖 网 络 中 ， 有 8 个 对 等 方 和 16 ZR a 一 条 单 - “AVE SEB fay (di 
用 了 底层 网 络 中 的 许多 条 物理 链 路 和 物理 路 由 天 
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a) 一 个 环形 DHT。 对 等 方 3 要 确定 谁 负责 键 11 b) 具有 捷径 的 环形 DHT 
图 2-27 在 环形 DHT 中 确定 最 邻近 键 


使 用 图 2-27a 中 的 环形 窗 盖 网 络 ， 现 在 假定 对 等 方 3 要 确定 DHT 中 的 哪个 对 等 方 负责 
键 11。 使 用 该 坏 形 窗 盖 网 络 ， 初 始 对 等 方 (对 等 方 3) 生成 一 个 报 文 ， 问 “ 谁 负 责 键 
11?” 并 绕 环 顺 时 针 发 送 该 报 文 。 无 论 何 时 某 对 等 方 接收 到 该 报 文 ， 因 为 它 知道 其 后 继 和 
前任 的 标识 特 ， 它 能 够 确定 是 否 由 它 负 责 ( 即 最 邻近 ) 查询 中 的 键 。 如 果菜 对 等 方 不 负责 
ZEE, E ARAG AIO EEA E KIT E. 因此 ， 例 如 当 对 等 方 4 接收 到 询问 键 11 的 报 文 
它 确 定 自 己 不 负责 该 键 (因为 其 后 继 更 邻近 该 键 ) ， 故 它 只 需 将 该 报 文 传递 给 对 等 方 5 
这 个 过 程 直 到 该 报 文 到 达 对 等 方 12 才 终止 ， 对 等 方 12 确定 自己 是 最 邻近 键 11 的 对 等 方 . 
此 时 ， 对 等 方 12 能 够 加 查询 的 对 等 方 即 对 等 方 3 回 送 一 个 报 文 ， 指 出 自己 负责 键 11 . 

为 减少 每 个 对 等 方 必须 管理 的 窗 盖 信息 的 数量 ， 环 形 DHT 提供 了 一 种 非常 精确 有 效 
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的 解决 方案 。 特 别 是 ， 每 个 对 等 方 只 需要 知道 两 个 对 等 方 ， 即 它 的 直接 后 继 和 直接 前 任 ， 
但 该 解决 方案 也 引入 了 一 个 新 间 题 。 尽管 每 个 对 等 方 仅 知道 两 个 邻居 对 等 方 ， 但 为 了 找到 
负责 的 键 〈 在 最 差 的 情况 下 ) DHT jè 的 ) 所 有 N 个 结 点 将 必须 绕 环 转发 该 报 文 ; 平均 发 送 
N/2 条 报 文 

所 以 ， 在 设计 DHT 时， 在 每 个 对 等 方 必须 跟踪 的 邻居 数量 与 DHT 为 解析 一 Eai 而 
需要 发 送 的 报 文 数量 之 间 存 在 着 折 中 .一 方面 ， 如 果 每 个 对 等 方 联系 所 有 其 他 对 等 方 (网 
状 敌 盖 网 络 ) ， 则 每 个 查询 仅 发 送 一 个 报 文 ， 但 每 个 对 等 方 必须 关联 NA 个 对 等 方 。 i 
方面 ， 使 用 环形 DHT， 每 个 对 等 方 仅 知 道 两 个 对 等 方 ， 但 对 每 个 查询 平均 要 发 送 N/2 条 
oe 广 运 的 是 ,我们 能 够 完善 DHT 设计 ， 使 每 个 对 等 方 的 邻居 数量 和 每 次 查询 的 报 文 

量 部 保持 在 可 接受 的 范围 内 。 细 化 的 方案 之 一 是 以 该 环形 窗 盖 网 络 为 基础 ， 但 增加 “ 捷 

双 ”， 使 每 个 对 等 方 不 仅 联系 它 的 直接 后 继 和 直接 前 任 ， 而 且 联 系 分 布 在 环 上 的 数量 相对 
lint 这 种 具有 某 些 捷径 的 环形 DHT 的 例子 显示 在 图 2-27b 中 - 使 用 捷径 来 加 
pn ma ne ney ae ` 键 的 报 文 时 ， ay 最 
接近 该 键 的 邻 大 (后继 邻居 或 捷径 邻居 之 一 ) 转发 该 报 文 。 所 以 ， 在 网 2-27b 中 ， 当 对 等 
Ay 4 接收 到 请 求 键 11 ae rico (在 Baise ) 对 该 键 最 邻近 的 对 等 方 是 它 的 捷 
径 邻 届 10， 并 且 百 接 疝 对 等 方 10 转发 该 报 文 。 显然 ， 捷 径 能 够 大 大 减少 用 于 处 理 查 询 的 
报 文 数量 

下 一 人 是 : “一 个 对 等 方 应 当 有 多 少 条 捷径 ， 哪 些 对 等 方 应 当成 为 这 些 捷 
径 邻 居 ? ”该 问题 已 经 受到 研究 界 的 高 度 重视 | Balakrishnan 2003; Androutsellis — Theotokis 
2004). 重要 的 是 ， 研 究 表明 DHT We te dl ee 量 以 及 每 个 请 求 的 报 文 
数量 均 为 0(log N), HP N 是 对 等 方 的 数量 。 这 种 设计 给 出 了 了 使 用 网 状 和 环形 覆盖 网 络 
Th AY AS BP AR Hi 部 解决 方 案 之 间 enh He 

2. 对 等 方 扰动 

在 P2P 系统 中 ， 对 等 方 能 够 不 加 绾 示 地 到 来 和 离 去 。 因 此 ， 当 设计 一 个 DHT 时 ,我 
们 也 必须 关注 存在 这 种 对 等 方 扰动 时 维护 DHT 的 情况 。 为 了 更 好 地 理解 处 理 这 个 问题 所 
使 用 的 方法 ,我 们 再 次 考虑 图 2-27a 中 的 环形 DHT。 为 处 理 对 等 方 扰动 ， 我们 此 时 将 要 求 
每 个 对 等 方 联系 其 第 一 个 和 第 二 个 后 继 〈 即 知道 它们 的 IP 地址); 例如， 对 等 方 4 此 时 
联系 对 等 方 5 和 对 等 方 8。 我 们 也 要 求 每 个 对 等 方 周 期 性 地 证 实 它 的 两 个 后 继 是 存活 的 
( 例如， 通过 周期 性 地 回 它 们 发 送 ping 报 文 并 寻求 啊 应 ) 。 现 在 我 们 考虑 当 某 对 等 方 突 
然 离 开 时 DHT 如 何 维护 DHT,。 例 如， 假定 图 2-27a 中 的 对 等 方 $ 突然 离开 ,， 在 此 情况 
下 ， 因 为 对 等 方 5 不 再 啊 应 ping 报 文 ， 在 离开 的 对 等 方 之 前 的 两 个 对 等 方 (4 和 3) 得 
类 5 已 经 离开 。 对 等 方 4 和 3 因此 需要 更 新 它们 后 继 的 状态 信息 。 我 们 考虑 对 等 方 4 更 
新 其 状态 的 方 法 ; 

e 对 等 方 4 用 它 的 第 二 个 后 继 (对 等 方 8) 来 代替 它 的 第 一 个 后 继 (对 等 方 5)， 

e 然后 对 等 方 4 回 新 的 第 一 个 后 继 询 问 它 的 直接 后 继 (对 等 方 10) 的 标识 符 和 下 地 

址 。 然 后 对 等 方 4 将 对 等 方 10 标记 为 它 的 第 二 个 后 继 。 

在 课 后 习题 中 ， 请 你 确定 对 等 方 3 是 如 何 更 新 它 的 覆盖 路 由 选择 信息 

在 简要 地 讨论 了 一 个 对 等 方 离开 时 必须 要 做 的 事后 ， 我 们 现在 若 虑 当 一 个 对 等 方 要 加 
A DHT 时 发 生 的 事情 ,假如 一 个 标识 符 为 13 的 对 等 方 要 加 入 该 DHT， 在 加 入 时 ， 它 仅 知 
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站 对 等 方 1 存在 于 该 DHT 之 中 。 对 等 方 13 将 先 要 回 对 等 方 1 发 送 一 条 报 文 ， 说 “13 的 前 
任 和 后 继 是 什么 ?” 该 报 文 将 通过 DHT 到 达 对 等 方 12， 而 它 认识 到 自己 将 是 13 的 前 任 ， 
并 且 它 的 当前 后 继 即 对 等 方 15 将 成 为 13 的 后 继 。 接 下 来 ， 对 等 方 12 向 对 等 方 13 发 送 它 
的 前 任 和 后 继 信 息 。 对 等 方 13 此 时 能 够 加 入 DHT， 标 识 它 的 后 继 为 对 等 方 1 5， 并 通知 对 
等 方 12 它 应 当 将 其 直接 后 继 改 为 13 。 
DHT 已 经 在 实践 中 得 到 了 广泛 使 用 。 例 如 ，BitTorrent 使 用 Kademlia DHT 来 产生 一 个 

分 布 式 跟 踊 器 。 在 BitTorrent 中 ， 其 键 是 洪流 标识 符 而 其 值 是 当前 参与 洪流 的 所 有 对 等 方 
的 IP 地址 [ Falkner 2007, Neglia 2007 | 。 以 这 种 方式 ， 通 过 用 某 洪流 标识 符 来 查询 DHT, 

一 个 新 到 达 的 BitTorrent 对 等 方 能 够 确定 负责 该 标识 符 ( 即 在 洪流 中 跟 足 对 等 方 ) 的 对 等 
方 。 在 找到 该 对 等 方 后 ， 到 达 的 对 等 方 能 够 问 它 查询 在 洪流 中 的 其 他 对 等 方 列 表 。 


2.7 TCP 套 接 字 编程 


我 们 已 经 看 到 了 一 些 重 要 的 网 络 应 用 ， 下 面 就 探讨 一 下 网 络 应 用 程序 是 如 何 实 际 编写 
的 。 在 2.1 市 讲 过 ， 典 型 的 网 络 应 用 是 由 一 对 程序 We 组 成 的 ， 
它们 位 于 两 个 不 同 的 闪 系 统 中 。 当 运行 这 两 个 程序 时 ， 创 建 了 一 个 客户 进程 和 一 个 服务 需 
进程 ， 同 时 它们 通过 从 套 接 字 读 出 和 写 人 数据 彼此 之 间 进 行 通信 。 开 发 者 创建 一 个 网 络 应 
用 时 ， 其 主要 任务 就 是 编写 客户 程序 和 服务 需 程 序 的 代码 ， 

网 络 应 用 程序 有 两 类 。 一 类 是 实现 在 协议 标准 (如 一 个 RFC 或 某 种 其 他 标准 文档 ) 
中 所 定义 的 操作 ;这样 的 应 用 程序 又 称 为 “开放 ”的 ， 因 为 定义 其 操作 的 这 些 规则 人 所 共 
知 。 对 于 这 样 的 实现 ， 客 户 程序 和 服务 器 程序 必须 遵守 由 该 REC 所 规定 的 规则 。 例 如 ， 
某 客 户 程序 可 能 是 FTP 协议 客户 端的 一 种 实现 ， 如 在 2. 3 节 所 描述 ， 该 协议 由 RFC 959 HH 
确定 义 ; 类 似 地 ， 其 服务 需 程 序 能 够 是 FTP 服务 需 协 议 的 一 种 实现 ， 也 明确 由 RFC 959 定 
义 。 如 果 一 个 开发 者 编写 客户 程序 的 代码 ， 另 一 个 开发 者 编写 服务 器 程序 的 代码 ， 并 且 两 
者 都 完全 遵从 该 RFC 的 各 种 规则 ， 那 么 这 两 个 程序 将 能 够 交互 操作 。 实 际 上 , 今天 大 多 
数 网 络 应 用 程序 涉及 客户 和 服务 器 程序 间 的 通信 ， 这 些 程序 都 是 由 不 同 的 程序 员 单 独 开发 
的 。 例 如 ， 与 Apache Web 服务 器 通信 的 Firefox 浏览 器 ， 或 与 BitTorrent 跟踪 器 通信 的 Bit- 
Torrent 客户 。 

男 一 类 网 络 应 用 程序 是 专用 的 网 络 应 用 程序 。 在 这 种 情况 下 ， 由 客户 和 服务 震 程 序 应 
用 的 应 用 层 协 议 没有 公开 发 布 在 某 RFC 中 或 其 他 地 方 。 某 单独 的 开发 者 MEAN 
创建 了 客户 和 服务 需 程 序 ， 并 且 该 开发 者 用 他 的 代码 完全 控制 程序 的 功能 。 但 是 因为 这 些 
代码 并 没有 实现 一 个 开放 的 协议 ， 其 他 独立 的 开发 者 将 不 能 开发 出 和 该 应 用 程序 交互 的 
代码 。 

在 本 节 中 ， 我 们 将 考察 研发 一 个 客户 -服务 器 应 用 程序 中 的 关键 问题 ， 我 们 将 “亲历 
亲 为 ”来 实现 一 个 非常 简单 的 客户 - 服务 器 应 用 程序 代码 。 在 研发 阶段 ， 开 发 者 必须 最 先 
做 的 一 个 决定 是 ， 应 用 程序 是 运行 在 TCP 上 还 是 运行 在 UDP 上 。 前 面 讲 过 TCP 是 面向 连 
接 的 ， 并 且 为 两 个 端 系统 之 间 的 数据 流动 提供 可 靠 的 字 节 流通 道 。UDP 是 无 连接 的 ， 从 一 
个 端 系统 回 另 一 个 端 系统 发 送 独立 的 数据 分 组 ， 不 对 交付 提供 任何 保证 。 前 面 也 讲 过 当 客 
户 或 服务 硕 程 序 实现 了 一 个 由 某 RFC 定义 的 协议 ， 它 应 当 使 用 与 该 协议 关联 的 周知 端口 
号 ; 与 之 相反 ， 当 研发 一 个 专用 应 用 程序 ， 研 发 者 必须 注意 避免 使 用 这 样 的 周知 端口 号 。 
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(只 口号 已 在 2.1 市 简要 讨论 过 。 它们 将 在 第 3 章 中 更 为 详细 地 涉及 。 ) 

我 们 通过 一 个 简单 的 UDP 应 用 程序 和 一 个 简单 的 TCP 应 用 程序 来 介绍 UDP 和 TCP $ 
接 字 编程 。 我 们 用 Python 语言 来 呈现 这 些 简单 的 TCP 和 UDP 程序 。 也 可 以 用 Java, C 或 
C ++ 来 编写 这 些 程序 ， 而 我 们 选择 用 Python 最 主要 原因 是 Python 清楚 地 揭示 了 关键 的 套 
接 字 概念 。 使 用 Python, ， 代 码 的 行 数 更 少 ， 并 且 向 新 编程 人 员 解 释 每 一 行 代码 不 会 有 太 大 
困难 .如 果 你 不 熟悉 Python ， 也 用 不 着 担心 ， 只 要 你 有 过 一 些 用 Java、C 或 C ++ 编程 的 经 
稚 ， 怠 应 该 很 容易 看 得 情 下 面 的 代码 。 

如 果 读 者 对 用 Java 进行 客户 - 服务 融 编 程 感 兴趣 ， 建 议 你 去 查看 与 本 书 配套 的 Web 
网 站 。 事实 上 ， 能 够 在 那里 找到 用 Java 编写 的 本 节 中 的 所 有 例子 (和 相关 的 实验 ) 。 如 果 
污 者 对 用 C 进行 客户 - 服务 器 编程 感 兴趣 ， 有 一 些 优 秀 参考 资料 可 供 使 用 [ Donahoo 
2001; Stevens 1997; Frost 1994; Kurose 1996 | 。 我 们 下 面 的 Python 例子 具有 类 似 于 C 的 外 
观 和 感觉 。 


2.7.1 UDP 套 接 字 编 程 


在 本 小 三 中 ， 我 们 将 编写 使 用 UDP 的 简单 客户 -服务 器 程序 ; 在 下 一 小 节 中 ， 我 们 
将 编写 使 用 TCP. 的 简单 程序 . 

2.1 节 讲 过 ， 运 行 在 不 同 机 如 上 的 进程 彼此 通过 问 套 接 字 发 送 报 文 来 进行 通信 。 我们 
说 过 每 个 进程 好 比 是 一 座 房 子 ， 该 进程 的 套 接 字 则 好 比 是 一 局 门 。 应 用 程序 位 于 房子 中 门 
的 一 侧 ; 运输 层 位 于 该 门 朝 外 的 另 一 侧 ， 应 用 程序 开发 者 在 套 接 字 的 应 用 层 一 侧 可 以 控制 
所 有 东西 ; 然而， 它 几 乎 无 法 控制 运输 层 一 侧 。 

现在 我 们 仔细 观察 使 用 UDP 套 接 字 的 两 个 通信 进程 之 间 的 交互 。 在 发 送 进程 能 够 将 
数据 分 组 推出 套 接 字 之 门 之 前 ， 当 使 用 UDP 时 ， 必 须 先 将 目的 地 址 附 在 该 分 组 之 上 。 在 
该 分 组 传 过 发 送 方 的 套 接 字 之 后 ， 因 特 网 将 使 用 该 目的 地 址 通过 因特网 为 该 分 组 选 路 到 接 
收 进程 的 套 接 字 。 当 分 组 到 达 接 收 套 接 字 时 ， 接 收 进程 将 通过 该 套 接 字 取 回 分 组 ， 进 而 检 
查分 组 的 内 容 并 采取 适当 的 动作 ， 

因此 你 可 能 现在 想 知 道 ， 附 在 分 组 上 的 目的 地 址 包含 了 什么 ”如 你 所 期 待 的 ， 目 的 主 
机 的 IP 地 址 是 目的 地 址 的 一 部 分 。 通 过 在 分 组 中 包括 目的 地 的 IP 地址， 因特网 中 的 路 由 
需 将 能 够 通过 因特网 将 分 组 选 路 到 目的 主机 。 但 是 因为 一 台 主 机 可 能 运行 许多 网 络 应 用 进 
程 ， 每 个 进程 具有 一 个 或 多 个 套 接 字 ， 所 以 在 目的 主机 指定 特定 的 套 接 字 也 是 必要 的 。 当 
生成 一 个 套 接 字 时 ， 就 为 它 分 配 一 个 称 为 端口 号 (port number) 的 标识 符 。 因 此 ， 如 你 所 
期 答 的 ， 分 组 的 目的 地 址 也 包括 该 套 接 字 的 端口 号 。 归 纳 起 来 ， 发 送 进程 为 分 组 附 上 的 目 
的 地 址 是 由 目的 主机 的 IP 地 址 和 目的 地 套 接 字 的 端口 号 组 成 的 。 此 外 ， 如 我 们 很 快 将 看 
到 的 那样 ， 发 送 方 的 源 地 址 也 是 由 源 主机 的 IP 地 址 和 源 套 接 字 的 端口 号 组 成 ， 该 源 地 址 
也 要 附 在 分 组 之 上 。 然 而 ， 将 源 地 址 附 在 分 组 之 上 通常 并 不 是 由 UDP 应 用 程序 代码 所 为 ， 
而 是 由 底层 操作 系统 自动 完成 的 ， 

我 们 将 使 用 下 列 简单 的 客户 -= 服务 器 应 用 程序 来 演示 对 于 UDP All TCP 的 套 接 字 编 程 : 

1) 客户 从 其 键盘 读 取 一 行 字 符 并 将 数据 向 服务 器 发 送 。 

2) 服务 具 接 收 该 数据 并 将 这 些 字符 转换 为 大 写 。 

3) 服务 器 将 修改 的 数据 发 送 给 客户 。 

4) 客户 接收 修改 的 数据 并 在 其 监视 右上 将 该 行 显示 出 来 。 
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现在 我 们 自己 动手 来 查看 这 对 客户 - 服务 需 程 序 ， 用 UDP 实现 这 个 简单 应 用 程序 .我 


们 在 每 个 程序 后 也 提供 一 个 详 
发 送 一 个 简单 的 应 用 级 报 文 。 
经 在 运行 ， 这 就 是 说 ， 在 客户 


细 、 逐 行 的 分 析 。 我 们 将 以 UDP 客户 开始 ， 该 程序 将 向 服务 器 
服务 器 为 了 能 够 接收 并 回答 该 客户 的 报 文 ， 它 必须 准备 好 并 已 
发 送 其 报 文 之 前 ， 服 务 器 必须 作为 一 个 进程 正在 运行 - 


客户 程序 被 称 为 UDPClient. bpy， 服务 大 程序 被 称 为 UDPServer py, 为 强调 关键 问题 ， 


我 们 有 意 提 供 最 少 的 代码 。 


“好 代码 ”无 疑 将 具有 一 些 更 为 辅助 性 的 代码 行 ， 特 别 是 用 于 


处 理 出 现 差 错 的 情况 。 对 于 本 应 用 程序 ， 我 们 任意 选择 了 12000 EX RIA m H y 


1. UDPClient. py 


下 面 是 该 应 用 程序 客户 端的 代码 : 


from socket import * 
serverName = ‘hostname’ 
serverPort = 12000 


clientSocket = socket(AF_INET, SOCK_DGRAM) 

message = raw_input(’Input lowercase sentence: ’) 
clientSocket.sendto(message,(serverName, serverPort) ) 
modifiedMessage, serverAddress = clientSocket.recvfrom(2048) 


print modifiedMessage 
clientSocket.close() 


现在 我 们 看 在 UDPClient. 


from socket import * 


py 中 的 各 行 代码 。 


该 socket 模块 形成 了 在 Python 中 所 有 网 络 通 信 的 基础 。 包 括 了 这 行 ， 我 们 将 能 够 在 程 


序 中 创建 套 接 字 To 
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serverName = ‘hostname’ 
serverPort = 12000 


第 一 行将 变量 serverName FYE FFA “hostname”, 这里， 我 们 提供 了 或 者 包含 服务 
种 的 IP 地 址 (如 “128. 138. 32. 126”) ake TAR AAI ELA (40 “cis. poly. edu”) 的 
字符 串 。 如 琳 我 们 使 用 主机 名 ， 则 将 目 动 执 行 DNS lookup 从 而 得 到 IP 地址。 第 二 行将 整 
AYR hr serverPort Fey 12000. 

clientSocket = socket(socket.AF INET, socket.SOCK_DGRAM) 

APO FAY BAR, PK clientSocket, 4i—PB Ba FHIR; 特别 是 ， 
AF_INET 指示 了 底层 网 络 使 用 了 IPv4。 (此 时 不 必 担 心 ， 我 们 将 在 第 4 草 中 讨论 IPv4.) 
第 二 个 参数 指示 了 了 该 套 接 字 是 SOCK_DCRAM 类 型 的 ， 这 意味 着 它 是 一 个 UDP 套 接 字 (而 
不 是 一 个 TCP 套 接 字 ) 。 值 得 注意 的 是 ， 当 创建 套 接 字 时 ， 我 们 并 没有 指定 客户 套 接 字 的 
端口 号 ; 相反， 我 们 让 操作 系统 为 我 们 做 这 件 事 。 既 然 客户 进程 的 门 已 经 创建 ， 我 们 将 要 
生成 通过 该 门 发 送 的 报 文 。 

message = raw_input(’Input lowercase sentence: ’) 

raw_input() 是 Python 中 的 内 置 功 能 。 当 执行 这 条 命令 时 ， 在 客户 上 的 用 户 将 以 单词 
“Input lowercase sentence:” 进 行 提 示 ， 用 户 使 用 她 的 键盘 来 输入 一 行 ， 这 被 放 入 变量 
message 中 。 既 然 我 们 有 了 一 个 套 接 字 和 一 条 报 文 ， 我 们 将 要 通过 该 套 接 字 回 目的 主机 发 
送 报 文 。 

clientSocket.sendto(message, (serverName, serverPort) ) 

在 上 述 这 行 中 ， 方 法 sendto() 为 报 文 附 上 目的 地 址 〈serverName，serverPort) 并 且 问 
进程 的 套 接 字 clientSocket 发 送 结 果 分 组 。( 如 前 面 所 述 ， 源 地 址 也 附 到 分 组 上 ， 尽 管 这 是 
日 动 完成 的 ， 而 不 是 显 式 地 由 代码 完成 的 ,) 经 一 个 UDP 套 接 字 发 送 一 个 客户 到 服务 融 的 
报 文 非常 简单 ! 在 发 送 分 组 之 后 ， 客 户 等 竺 接收 来 自 服务 需 的 数据 。 

modifiedMessage, serverAddress = clientSocket.recvfrom(2048) 

对 于 上 述 这 行 ， 当 一 个 来 目 因 特 网 的 分 组 到 达 该 客户 套 接 字 时 ， 该 分 组 的 数据 被 放置 
到 变量 modifiedMessage 中 ， 其 源 地 址 被 放置 到 变量 serverAddress H. Z iE serverAddress 包 
含 了 服务 器 的 中 地 址 和 服务 需 的 端口 号 . 程序 UDPClient 实际 上 并 不 需要 服务 胡 的 地 址 信 
县 ， 因 为 它 从 起 始 就 已 经 知道 了 该 服务 部 地 址 ; 而 这 行 Python 代码 仍然 提供 了 服务 天 的 地 
fit. 方法 reevfrom 也 取 绥 存 长 度 2048 作为 输入 。( 该 缓存 长 度 用 于 多 种 目的 ,) 

print modifiedMessage 

这 行 在 用 户 显示 右上 打印 出 modifiedMessage。 它 应 当 是 变 用 户 键入 的 原 妨 行 ， 现 在 只 
是 变 为 大 写 的 了 。 


clientSocket.close() 


该 行 关闭 了 套 接 字 。 然 后 关闭 了 该 进程 。 
2. UDPServer. py 


现在 来 看 看 这 个 应 用 程序 的 服务 闫 痊 : 

from socket import * 

serverPort = 12000 

serverSocket = socket(AF_INET, SOCK _DGRAM) 

serverSocket.bind((’’, serverPort) ) 

print “The server is ready to receive” 

while true: 
message, clientAddress = serverSocket.recvfrom( 2048) 
modifiedMessage = message.upper() 
serverSocket.sendto(modifiedMessage, clientAddress) 





注意 到 UDPServer 的 开始 部 分 与 UDPClient 类 似 。 它 也 是 导 和 人 套 接 字 模块 ， 也 将 整数 
变量 serverPort 设置 为 12000， 并 且 也 创建 套 接 字 类 型 SOCK_DGRAM (一 种 UDP 套 接 字 ) 。 
与 UDPClient 有 很 大 不 同 的 第 一 行 代码 是 : 

serverSocket.bind((’’, serverPort) ) 

上 面 行将 端口 号 12000 SRA ANE SESE 〈( 即 分 配 ) 在 一 起 。 因 此 在 UDPServer 
中 ，( 由 应 用 程序 开发 者 编写 的 ) 代码 显 式 地 为 该 套 接 字 分 配 一 个 端口 号 。 以 这 种 方式 ， 
当 任 何人 向 位 于 该 服务 器 的 UP 地 址 的 端口 12000 发 送 一 个 分 组 ， 该 分 组 将 指向 该 套 接 字 。 
UDPServer 然后 进入 一 个 while 循环 ; 该 while 循环 将 允许 UDPServer 无 限期 地 接收 并 处 理 
来 自 客户 的 分 组 。 在 该 while 循环 中 ，UDPSserver 等 得 一 个 分 组 的 到 达 。 

message, clientAddress = serverSocket.recvfrom(2048) 

这 行 代 码 类 似 于 我 们 在 UDPClient 中 看 到 的 。 当 某 分 组 到 达 该 服务 器 的 套 接 字 时 ， 
该 分 组 的 数据 被 放置 到 变量 message 中 ， 其 源 地 址 被 放置 到 变量 clientAddress 中 。 变 量 
clientAddress 包含 了 客户 的 IP 地 址 和 客户 的 端口 号 。 这 里 ，UDPServer 将 利用 该 地 址 信息 ， 
因为 它 提 供 了 返回 地 址 ， 类 似 于 普通 邮政 邮件 的 返回 地 址 。 使 用 该 源 地 址 信息 ， 服 务 需 此 
时 知道 了 它 应 当 将 回答 发 回 何 处 。 

modifiedMessage = message.upper!() 

此 行 是 这 个 简单 应 用 程序 的 关键 部 分 。 它 获取 由 客户 发 送 的 行 并 使 用 方法 upper() 将 
其 转换 为 大 与 。 

serverSocket.sendto(modifiedMessage, clientAddress) 

最 后 一 行将 该 客户 的 地 址 (IP 地 址 和 端口 号 ) 附 到 大 写 报 文 上 ， 并 将 所 得 的 分 组 发 
送 到 服务 顺 的 套 接 字 中 。( 如 前 面 所 述 ， 服 务 带 地 址 也 附 在 分 组 上 ， 尽 管 这 是 目 动 而 不 是 
显 式 地 由 代码 完成 的 ,) 因特网 则 将 分 组 交付 到 该 客户 地 址 。 在 服务 带 发 送 该 分 组 后 ， 它 
仍 维持 在 while 循环 中 ， 等 待 ( 从 运行 在 任 一 台 主 机 上 的 任何 客户 发 送 的 ) 为 一 个 UDP 分 
组 到 达 。 

为 了 测试 这 对 程序 ， 可 在 一 台 主 机 上 运行 UDPClient py， 并 在 为 一 台 主 机 上 运行 
UDPServer. py。 保 证 在 UDPClient. py 中 包括 适当 的 服务 做 主机 名 或 耳 地 址 。 接 下 来 ， 在 服 
务 器 主机 上 执行 编译 的 服务 器 程序 UDPServer py。 这 在 服务 器 上 创建 了 一 个 进程 ， 等 待 春 
某 个 客户 与 之 联系 。 然 后 ， 在 客户 主机 上 执行 编译 的 客户 天 程序 UDPClient pys HEK P 
上 创建 了 一 个 进程 。 最 后 ， 在 客户 上 使 用 应 用 程序 ， 键 入 一 个 句子 并 以 回 车 结束 。 

可 以 通过 稍 加 修改 上 述 客户 和 服务 天 程序 来 研制 目 己 的 UDP 客户 - 服务 化 程序 。 例 
如 ， 不 必 将 所 有 字母 转换 为 大 写 ， 服 务 器 可 以 计算 字母 s 出 现 的 次 数 并 返回 该 数字 。 或 者 
能 够 修改 客户 程序 ， 使 得 收 到 一 个 大 写 的 句子 后 , 用户 能 够 回 服务 大 继续 发 送 更 多 的 
句子 。 


2.7.2 TCP 套 接 字 编程 


与 UDP 不 同 ，TCP 是 一 个 面向 连接 的 协议 。 这 意味 着 在 客户 和 服务 豆 能 够 开始 互相 
发 送 数据 之 前 ， 它 们 先 要 握手 和 创建 一 个 TCP 连接 。TCP 连接 的 一 端 与 客户 套 接 字 相 联 
系 ， 另 一 端 与 服务 器 套 接 字 相 联系 。 当 创建 该 TCP 连接 时 ,我 们 将 其 与 客户 套 接 字 地 址 
CIP 地 址 和 端口 号 ) 和 服务 器 套 接 字 地 址 (IP 地 址 和 端口 号 ) 关联 起 来 。 使 用 创建 的 TCP 
连接 ， 当 一 侧 要 问 另 一 侧 发 送 数据 时 ， 它 只 需 经 过 其 套 接 字 将 数据 丢 给 TCP 连接 。 这 与 
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UDP Ala], UDP 服务 需 在 将 分 组 丢 进 套 接 字 之 前 必须 为 其 附 上 一 个 目的 地 地 址 。 

现在 我 们 仔细 观察 一 下 TCP 中 客户 程序 和 服务 器 程序 的 交互 。 客 户 具有 问 服 务 器 发 起 
接触 的 任务 。 服 务 器 为 了 能 够 对 客户 的 初始 接触 做 出 反应 ， 服 务 器 必须 已 经 准备 好 。 这 意 
味 看 两 件 事 。 第 一 ， 与 在 UDP 中 的 情况 一 样 ，TCP 服务 融 在 客户 试 网 发 起 接触 前 必须 作 
为 进程 运行 起 来 。 第 二 ， 服 务 需 程序 必须 具有 一 而 特殊 的 门 ， 更 精确 地 说 是 一 个 特 丈 的 套 
接 字 ， 该 门 欢迎 来 自 运 行 在 任意 主机 上 的 客户 进程 的 某 些 初始 接触 。 使 用 房子 / 门 来 比喻 
进程 / 套 接 字 ， 有 时 我 们 将 客户 的 初始 接触 称 为 “ 敲 欢迎 之 门 ”。 

随 着 服务 硕 进 程 的 运行 ， 客 户 进程 能 够 回 服务 器 发 起 一 个 TCP 连接。 这 是 由 客户 程序 
通过 创建 一 个 TCP 套 接 字 完成 的 。 当 该 客户 生成 其 TCP 套 接 字 时 ， 它 指定 了 服务 需 中 的 
欢迎 套 接 字 的 地 址 ， 即 服务 需 主 机 的 IP 地 址 及 其 套 接 字 的 端口 号 。 生 成 其 套 接 字 后 ， 该 
客户 发 起 了 一 个 三 次 握手 并 创建 与 服务 需 的 一 个 TCP 连接 。 发 生 在 运输 层 的 三 次 握手 ， 对 
于 客户 和 服务 需 程 序 是 完全 透明 的 。 

在 三 次 握手 期 间 ， 客 户 进程 禹 服务 需 进 程 的 欢迎 之 门 。 当 该 服务 硕 “ 上 听 ” 到 敲 门 时 ， 
它 将 生成 一 扇 新 门 〈 更 精确 地 讲 是 一 个 新 套 接 字 ) ， 它 专门 用 于 特定 的 客户 。 在 我 们 下 面 
的 例子 中 ， 欢 迎 之 门 是 一 个 我 们 称 为 serverSocket 的 TCP 套 接 字 对 象 ; 它 专门 对 客户 进行 
连接 的 新 生成 的 套 接 字 ， 称 为 连接 套 接 字 (connection Socket) 。 初 次 遇 到 TCP 套 接 字 的 学 
生 有 时 会 混 清 欢迎 套 接 字 (这 是 所 有 要 与 服务 顺 通 信 的 客户 的 起 始 接触 点 ) 和 每 个 新 生成 
的 服务 需 侧 的 连接 套 接 字 (这 是 随后 为 与 每 个 客户 通信 而 生成 的 套 接 字 ) 。 

从 应 用 程序 的 观点 来 看 ， 客 户 套 接 字 和 服务 需 连 接 套 接 字 直接 通过 一 根 管 道 连接 。 如 
图 2-29 所 示 ， 客 户 进程 可 以 回 它 的 套 接 字 发 送 任意 字 节 ， 并 且 TCP 保证 服务 需 进 程 能 够 
FEATS MURA 〈 通 过 连接 套 接 字 ) BPE. TCP 因此 在 客户 和 服务 需 进 程 之 加 提供 
了 可 靠 服 务 。 此 外 ， 就 像 人 们 可 以 从 同一 书 门 进 和 出 一 样 ， 客 户 进程 不 仅 能 回 它 的 套 接 字 
发 送 字 节 ， 也 能 从 中 接收 字 节 ; 类 似 地 ， 服 务 器 进程 不 仅 从 它 的 连接 套 接 字 接收 字 节 ， 也 





服务 器 进程 





TCPServer 进程 有 两 个 套 接 字 
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我 们 使 用 同样 简单 的 客户 - 服务 带 应 用 程序 来 展示 TCP 套 接 字 编 程 : KPRI Ar 
送 一 行 数据 ， 服 务 需 将 这 行 改 为 大 写 并 回 送 给 客户 - 网 2-30 着 重 显示 了 客户 和 服务 硕 的 
主要 与 套 接 字 相关 的 活动 ,两 者 通过 TCP 运输 服务 进行 通信 

WR Ai 客户 
(在 ServerIP 上 运行 ) 


对 到 来 的 请 求 创建 套 接 字 ， 

Portex o, 

: £ eee = 
socket () 


| 


-o a ee ce eee TCP 
等 竺 入 连接 请 求 ， 连接 建立 - gybRBservert> 
connectionSocket = 人 > WES, port=x: 
serverSocket .accept () clientSocket = socket () 
| 
x 


使 用 clientSocket 


a T 


Mannaert net F Meliensocket 


k : | 读 响 应 
do | 


。 SRfiictientSocket 





图 2-30 ”使 用 TCP 的 客户 -服务 器 应 用 程序 
1. TCPClient. py 
这 里 给 出 了 应 用 程序 客户 端的 代码 : 


from socket import * 

serverName = ‘servername’ 

serverPort = 12000 

clientSocket = socket(AF INET, SOCK STREAM) 
clientSocket.connect((serverName,serverPort ) ) 
sentence = raw_input( ‘Input lowercase sentence:’ ) 
clientSocket.send(sentence) 

modifiedSentence = clientSocket.recv(1024) 

print ‘From Server:’, modifiedSentence 
clientSocket.close( ) 


现在 我 们 查看 这 些 代 码 中 的 与 UDP 实现 有 很 大 差别 的 各 行 。 首当其冲 的 行 是 客户 套 
接 字 的 创建 。 

clientSocket = socket(AF_INET, SOCK STREANM) 

该 行 创建 了 客户 的 套 接 字 ， 称 为 clientSocket。 第 一 个 参数 仍 指示 底层 网 络 使 用 的 是 
IPv4。 第 二 个 参数 指示 该 套 接 字 是 SOCK_STREAM 类 型 。 这 表明 它 是 一 个 TCP ERF ( 而 不 
是 一 个 UDP 套 接 字 ) 。 值 得 注意 的 是 当 我 们 创建 该 客户 套 接 字 时 仍 未 指定 其 端口 号 ; AR, 
我 们 让 操作 系统 为 我 们 做 此 事 。 此 时 的 下 一 行 代码 与 我 们 在 UDPClient 中 看 到 的 极为 不 同 : 
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clientSocket.connect((serverName,serverPort) ) 


前 面 讲 过 在 客户 能 够 使 用 一 个 TCP 套 接 字 向 服务 器 发 送 数据 之 前 〈 反 之 亦 然 ) ， 
作客 户 与 服务 大 之 间 创 建 一 个 TCP 连接。 上 面 这 行 就 发 起 了 客户 和服 务 器 之 的 这 条 TCP 
连接 ，connect( ) 方 法 的 参数 是 这 条 连接 中 服务 顺 端 的 地 址 。 这 行 代码 执行 完 后 ， 执 行 三 次 
握 于 ， 并 在 客 尸 和 服务 器 之 间 创 建 起 一 条 TO 连接 。 

sentence = raw_input(‘Input lowercase sentence:’) 

如 同 UDPClient 一 样 ， 上 一 行 从 用 户 获 得 了 一 个 句子 。 字 符 串 sentence 连续 收集 字符 
直到 用 户 键 人 回 车 以 终止 该 行为 止 。 代 码 的 下 一 行 也 与 UDPClient 极为 不 同 : 

clientSocket.send(sentence) 

上 一 行 通过 该 客户 的 套 接 字 并 进入 TCP 连接 发 送 字符 串 sentence。 值 得 注意 的 是 ， 该 
程序 并 未 显 式 地 创建 一 个 分 组 并 为 该 分 组 附 上 目的 地 址 ， 而 使 用 UDP 套 接 字 却 要 那样 做 。 
相反 ， 客 户 程序 只 是 将 字符 串 sentence 中 的 字 节 放 入 该 TCP 连接 中 去 。 客 户 然后 就 等 待 接 
WOK ARS ae AS ET 

modifiedSentence = clientSocket.recv(2048) 

当 字符 到 达 服务 器 时 ， 它 们 被 放置 在 字符 串 modifiedSentence 中 。 字 符 继续 积累 在 
modifiedSentence 中 ， 直 到 收 到 回 车 符 才 会 结束 该 行 。 在 打印 大 写 句子 后 ， 我 们 关闭 客户 的 
KF. 

clientSocket.close() 

后 一 行 关闭 了 套 接 字 ， 因 此 关闭 了 客户 和 服务 器 之 间 的 TCP 连接 。 它 引起 客户 中 的 
TCP 向 服务 器 中 的 TCP 发 送 一 条 TCP 报 文 (参见 3.5 节 ) 。 
2. TCPServer. py 
现在 我 们 看 一 下 服务 器 程序 


from socket import * 

serverPort = 12000 

serverSocket = socket(AF_ INET,SOCK STREAM) 

serverSocket.bind((‘’,serverPort) ) 

serverSocket.listen(1l) 

print ‘The server is ready to receive’ 

while 1: 
connectionSocket, addr = serverSocket.accept() 
sentence = connectionSocket.recv(1024) 
capitalizedSentence = sentence.upper() 
connectionSocket.send(capitalizedSentence) 
connectionSocket.close() 


现在 我 们 来 看 看 上 述 与 UDPServer 及 TCPClient 有 显著 不 同 的 代码 行 。 与 TCPClient 相 
同 的 是 ， 服 务 吉 创建 一 个 TCP 套 接 字 ， 执 行 : 
serverSocket=socket (AF INET,SOCK STREAM) 


与 UDPServer 类 似 ， 我 们 将 服务 器 的 端口 号 serverPort 与 该 套 接 字 关 联 起 来 : 

serverSocket.bind((‘‘,serverPort) ) 

但 对 TCP M A, serverSocket 将 是 我 们 的 欢迎 套 接 字 。 在 创建 这 扇 欢 迎 之 门 后 ， 我 们 
将 等 待 并 聆听 某 个 客户 敲 门 : 

serverSocket.listen(1) 

ATTICA SS tt OKRA RP ay TCP 连接 请 求 。 其 中 参数 定义 了 请 求 连接 的 最 大 数 
(至 少 为 1)。 


connectionSocket, addr = serverSocket.accept() 
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当 客 户 斋 该 门 时 ， 程 序 为 serverSocket 调用 accept() ， 这 在 服务 器 中 创建 了 一 个 称 为 
connectionSocket 的 新 套 接 字 ， 由 这 个 特定 的 客户 专用 .客户 和 服务 硕 则 完成 了 握手 ， 在 客 
户 的 clientSocket 和 服务 器 的 serverSocket 之 间 创 建 了 一 个 TCP 连接 。 借 助 于 创建 的 TCP 连 
接 ， 客 户 与 服务 需 现在 能 够 通过 该 连接 相互 发 送 字 节 。 使 用 TCP， 从 一 侧 发 送 的 所 有 字 三 
不 仅 确保 到 达 另 一 侧 ， 而 且 确 保 按 序 到 达 . 


connectionSocket.close( ) 

在 此 程序 中 ， 在 加 客户 发 送 修改 的 句子 后 ， 我 们 关闭 了 该 连接 套 接 字 。 但 由 于 server- 
Socket 保持 打开 ， 所 以 另 一 个 客户 此 时 能 够 殴 门 并 加 该 服务 带 发 送 一 个 句子 要 求 修改 . 

我 们 现在 完成 了 TCP 套 接 字 编 程 的 讨论 . 建议 你 在 两 人 台 单 独 的 主机 上 运行 这 两 个 程 
Pe. 也 可 以 修改 它们 以 达到 稍微 不 同 的 目的 。 你 应 当 将 前 面 两 个 UDP 程序 与 这 两 个 TCP 
程序 进行 比较 ， 观 察 它们 的 不 同 之 处 。 E apni 
程 人 作业。 最后， 我们 希望 在 掌握 了 这 些 和 更 先进 的 套 接 字 程序 后 的 人 寻 大， 你 将 能 够 编写 你 
et nn 
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在 本 章 中 ,我们 从 概念 和 实现 两 方面 对 网 络 应 用 进行 学习。 我 们 学 习 了 被 因特网 应 
He 遍 采 用 的 客户 -服务 器 模式 ， 并 且 知 道 了 该 模式 在 HTTP、FTP、SMTP、POP3 和 DNS 
等 协议 中 的 使 用 。 我 们 已 经 更 为 详细 地 学 习 了 这 些 重 要 的 应 用 层 协议 以 及 与 之 对 应 的 相关 
应 用 ( Web、 文件 传输 、 电 子 邮件 和 DNS)。 我 们 也 已 学 习 了 日 益 流 行 的 P2P 体系 结构 以 

及 它 如 何 应 用 在 许多 应 用 程序 中 。 我 们 还 探讨 了 使 用 套 接 字 API 构建 网 络 应 用 程序 的 方 
法 。 我们 考察 了 面 回 连接 的 (TCP) 和 无 连接 的 (UDP) span glen 服务 中 的 套 接 字 应 
用 至此， 我 们 在 分 层 的 网 络 体系 结构 中 的 癌 下 之 旅 已 经 完成 了 第 一 

在 本 书 一 开始 的 1.1 节 中 ， et ne re a 
或 多 个 通信 实体 之 间 交 换 报 文 的 格式 和 次 序 ， 以 及 对 某 报 文 或 其 他 事件 传输 和 /或 接收 所 
采取 的 动作 。 KERAF, ， 特 别 是 我 们 对 HTTP, FTP, SMTP, POP3 和 DNS 协议 进行 
的 细致 研究 ， 已 经 为 这 个 定义 加 入 了 相当 可 观 的 实质 性 的 内 容 。 协 议 是 网 络 连接 中 的 核心 

概念 ; 对 应 用 层 协议 的 学 习 ， 为 我 们 提供 了 有 关 协 议 内 涵 的 更 为 直觉 的 认识 。 

在 2.1 WP, Fela £ TCP 和 UDP 为 调用 它们 的 应 用 提供 的 服务 模型 。 当 我 们 在 
2.7 节 中 开发 运行 在 TCP Al UDP 之 上 的 简单 应 用 程序 时 ， 我 们 对 这 些 服务 模型 进行 了 更 加 
深入 的 观察 。 然 而 ， 我 们 几乎 没有 介绍 TCP 和 UDP 是 如 何 提供 这 种 服务 模型 的 。 例 如 ， 
我 们 知道 TCP 提供 了 一 种 可 靠 数 据 服 务 ， 但 我 们 未 说 它 是 如 何 做 到 这 一 点 的 。 在 下 一 章 中 
我 们 将 不 仅 关 注 运 输 协议 是 什么 ， 而 且 还 关注 它 如 何 工 作 以 及 为 什么 要 这 么 做 ， 

有 了 因特网 应 用 程序 结构 和 应 用 层 协议 的 知识 之 后 ,我们 现在 准备 继续 沿 该 协议 栈 回 

， 在 第 3 草 中 探讨 运输 层 。 


课 后 习题 和 问题 





2.1 节 
R1. 列 出 5 种 非 专用 的 因特网 应 用 及 它们 所 使 用 的 应 用 层 协议 : 


R2. 


R3. 


R4. 


R5. 


RO. 


RE 


R8. 


R9. 


PA 


R10. 


RII. 


R12. 


R13. 


R14. 


R15. 


R16. 


R17. 


R18. 
R19. 


R20. 
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R23. 
R24. 


R25. 


2.7 
R26. 





网 络 体系 结构 与 应 用 程序 体系 结构 之 间 有 什么 区 别 ? 
对 两 进程 之 间 的 通信 会 话 而 言 ， 哪 个 进程 是 客户 ， 哪 个 进程 是 服务 颖 ? 
对 一 个 P2P 文件 共享 应 用 ， 你 同意 “一 个 通信 会 话 不 存在 客户 端 和 服务 器 端的 概念 ”的 说 法 吗 ? 为 
‘TA? 
运行 在 一 台 主 机 上 的 一 个 进程 ， 使 用 什么 信息 来 标识 运行 在 另 一 台 主 机 上 的 进程 ” 
假定 你 想 尽 快 地 处 理 从 远程 客户 到 服务 器 的 事务 ， 你 将 使 用 UDP 还 是 TCP? 为 什么 ? 
参见 图 2-4， 我 们 看 到 在 该 图 中 所 列 出 的 应 用 程序 没有 一 个 同时 既 要 求 无 数据 丢失 又 要 求 定时 的 。 你 
能 设想 一 个 既 要 求 无 数据 丢失 又 高 度 时 间 敏 感 的 应 用 程序 吗 ? 
列 出 一 个 运输 协议 能 够 提供 的 4 种 宽泛 类 型 的 服务 。 对 于 每 种 服务 类 型 ， 指 出 是 UDP 还 是 TCP (或 
这 两 种 协议 ) 提供 这 样 的 服务 ? 
前 面 讲 过 TCP 能 用 SSL 来 强化 ， 以 提供 进程 到 进程 的 安全 性 服务 ， 包括 加 密 。SSL 运行 在 运输 层 还 
是 应 用 层 ? 如 果 某 应 用 程序 研制 者 想 要 用 SSL 来 强化 UDP， 该 研制 者 应 当做 些 什 么 工作 ? 
“2. 5 
握手 协议 的 作用 是 什么 ? 
为 什么 HTTP, FTP, SMTP 及 POP3 都 运行 在 TCP， 而 不 是 UDP E? 
考虑 一 个 电子 商务 网 站 需要 保留 每 一 个 客户 的 购买 记录 。 描述 如 何 使 用 cookie 来 完成 该 功能 ? 
描述 Web 缓存 占 是 如 何 减少 接收 被 请 求 的 对 象 的 时 延 的 。Web 缓存 器 将 减少 一 个 用 户 请 求 的 所 有 
对 象 或 只 是 其 中 的 某 些 对 象 的 时 延 吗 ? 为 什么 ? 
Telnet 到 一 台 Web 服务 器 并 发 送 一 个 多 行 的 请 求 报 文 。 在 该 请 求 报 文中 包含 和- modified - since: 首 
部 行 ， 迫 使 啊 应 报 文 中 出 现 “304 Not Modified ”状态 代码 。 
为 什么 说 FTP 在 “ 带 外 ”发 送 控制 信息 ? 
假定 Alice 使 用 一 个 基于 Web 的 电子 邮件 账户 (例如 Hotmail 或 gmail) 向 Bob 发 报 文 ， 而 Bob 使 用 
POP3 从 他 的 邮件 服务 器 访问 自己 的 邮件 。 讨论 是 怎样 从 Alice 主机 到 Bob 主机 得 到 该 报 文 的 。 要 列 
出 在 两 台 主 机 间 移 动 该 报 文 时 所 使 用 的 各 种 应 用 层 协议 。 
将 你 最 近 收 到 的 报 文 首部 打印 出 来 。 其 中 有 多 少 Received: 首部 行 ? 分 析 该 报 文 的 首部 行 中 的 每 
FT 
从 用 户 的 观点 看 ，POP3 协议 中 下 载 并 删除 模式 和 下 载 并 保留 模式 有 什么 区 别 吗 ? 
一 个 机 构 的 Web 服务 器 和 邮件 服务 器 可 以 有 完全 相同 的 主机 名 别名 Aan, foo. com) 吗 ? 包 含 邮 
件 服务 器 主机 名 的 RR 有 什么 样 的 类 型 ? 
仔细 检查 收 到 的 电子 邮件 ， 查 找 由 使 用 . edu 电子 邮件 地 址 的 用 户 发 送 的 报 文 首部 。 从 其 首部 ， 能 
够 确定 发 送 该 报 文 的 主机 的 IP 地 址 吗 ?” 对 于 由 gmail 账号 发 送 的 报 文 做 相同 的 事 。 
$ 
{E BitTorrent 中 ， 假 定 Alice [e] Bob 提供 一 个 30 PA PAA SFR Ati. Bob 将 必须 进行 回报 ， 在 相 
同 的 间隔 中 辐 Alice 提供 文件 块 吗 ” 为 什么 ? 
考虑 一 个 新 对 等 方 Alice 加 入 BitTorrent 而 不 拥有 任何 文件 块 。 没 有 任何 块 ， 因 此 她 没有 任何 东西 可 
上 载 ， 她 无 法 成 为 任何 其 他 对 等 方 的 前 4 位 上 载 者 。 那 么 Alice 将 怎样 得 到 她 的 第 一 个 文件 块 呢 ? 
覆盖 网 络 是 什么 ” 它 包括 路 由 带 吗 ? 在 覆盖 网 络 中 边 是 什么 ? 
考虑 一 个 具有 网 状 短 盖 网 络 拓 扑 的 DHT ( 即 每 个 对 等 方 跟 踊 系统 中 的 所 有 对 等 方 )。 这 样 设计 的 优 
点 和 缺点 各 是 什么 ”环形 DAT (无 捷径 ) 的 优点 和 缺点 各 是 什么 ? 
列 出 至 少 4 个 不 同 的 应 用 ,它们 本 质 上 适合 P2P 体系 结构 。( 提 示 : 文件 分 布 和 即时 讯息 是 两 个 这 
样 的 应 用 ,) 


2.7 节 中 所 描述 的 UDP 服务 器 仅 需要 一 个 套 接 字 ， 而 TCP 服务 器 需要 两 个 套 接 字 。 为 什么 ”如 果 


116 Z 2# 


TCP WRF tection 个 并 行 连接 ， 每 条 连接 来 日 不 同 的 客户 主机 ， 那 么 TCP IRI iK m BBE 
接 字 ? 

R27. 对 于 2.7 节 所 描述 的 运行 在 TCP 之 上 的 客户 -服务 需 应 用 程序 ， 服 务 大 程序 为 什么 必须 先 于 客户 程 
序 运 行 ? 对 于 运行 在 UDP 之 上 的 客户 - 服务 右 应 用 程序 ， 客 户 程 序 为 什么 可 以 先 于 服务 更 程序 
运行 ? 


Pl. 是 非 判断 题 

a. 假设 用 户 请 求 由 某 些 文本 和 3 幅 图 像 组 成 的 Web 页 面 。 对 于 这 个 页 面 ， 客 户 将 发 送 一 个 请 求 报 文 
并 接收 4 个 啊 应 报 文 。 

b. 两 个 不 同 的 Web 页 面 (例如 ，www. mit. edu/research. html Æ www. mit. edu/students. html) 可 以 通 
过 同一 个 持续 连接 发 送 。 

c 在 浏览 融和 初始 服务 从 之 间 使 用 非 持 续 连 接 的 话 ， 一 个 TCP 报 文 段 是 可 能 携 市 两 个 不 同 的 HTTP 
服务 请 求 报 文 的 。 

d. 在 HTTP 响应 报 文中 的 Date: 首部 指出 了 该 响应 中 对 和 象 最 后 一 次 修改 的 时 间 ， 

e. HTTP 啊 应 报 文 决 不 会 具有 空 的 报 文 体 。 

P2. 阅读 有 关 FTP 的 RFC 959。 列 出 这 个 REC 所 支持 的 所 有 客户 命令 。 

P3. 考虑 一 个 HTTP 客户 要 获取 一 个 给 定 URL 的 Web 页面。 该 HTTP As a iy IP 地 址 开始 时 并 不 知道 ， 
在 这 种 情况 下 ,| 除了 HTTP 外 ， 还 需要 什么 运输 层 和 应 用 层 协议 ? 

P4. 考虑 当 浏览 器 发 送 一 个 HTTP GET 报 文 时 ， 通 过 Wireshark 俘获 到 下 列 ASCH 字符 串 〈( 即 这 是 一 个 
HTTP CET 报 文 的 实 k 内 容 )。 字符 <cr > <f> 是 回 车 和 换行 符 ( 下 面 文 本 中 的 和 斜体 字符 串 < er > 
表示 了 单个 回 车 符 ， 该 回 车 符 包 含 在 HTTP 首部 中 的 相应 位 置 )。 回 答 下 列 问题 ， 指 出 你 在 下 面 HT 
TP GET 报 文中 找到 答案 的 地 方 
GET /cs453/index.html HTTP/1.1l<cr><lf>Host: gai 
a.cs.umass.edu<cr><lf>User-Agent: Mozilla/5.0 ( 

Windows;U; Windows NT 5.1; en-US; rv:1.7.2) Gec 
ko/20040804 Netscape/7.2 (ax) <cr><lf>Accept:ex 

t/xml, application/xml, application/xhtml+xml, text 
/html;q=0.9, text/plain;q=0.8,image/png, */*;q=0.5 
<cr><lf>Accept-Language: en-us,en;q=0.5<cr><1lf>Accept- 
Encoding: zip,deflate<cr><lf>Accept-Charset: ISO 


-8859-1,utf-8;q=0.7,*;q=0.7<cr><lf>Keep-Alive: 300<cr> 
<lf>Connection: keep-alive<cr><1f><cr><lf> 


a. FAME ab iA SCRA URL 是 什么 

b. 该 浏览 器 运 行 的 是 HTTP 的 何 种 版 本 ? 

e. 该 i i cc aad lay 条 持续 连接 ? 

d. 该 浏览 锅 所 运行 的 主机 的 IP 地 址 是 什么 

e. 发 起 该 报 文 的 浏览 器 的 类 型 是 什么 ? 在 一 个 HTTP 请 求 报 文 中 ， 为 什么 需要 浏览 右 类 型 ? 
PS. 下 面 文本 中 显示 的 是 来 和 目 服 务 胡 的 回答 ， 以 啊 应 上 述 问 题 中 HTTP GET 报 文 。 回 答 下 列 问题 ， 指 出 

你 在 下 面 报 文中 找到 答案 的 地 方 。 

HTTP/1.1 200 OK<cr><lf>Date: Tue, 07 Mar 2008 

12:39:45GMT<cr><lf>Server: Apache/2.0.52 (Fedora) 

<cr><lf>Last-Modified: Sat, 10 Dec2005 18:27:46 

GMT<cr><l1f>ETag: “526c3-f£22-a88a4c80”"<cr><1f>Accept- 

Ranges: bytes<cr><lf>Content-Length: 3874<cr><lf> 

Keep-Alive: timeout=max=100<cr><l1f>Connection: 


Keep-Alive<cr><lf>Content-Type: text/html; charset= 
ISO-8859-l<cr><lf><cr><lf><!doctype html public “- 
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//w3c//dtd html 4.0 transitional//en”><1f><html><1f> 
<head><lf> <meta http-equiv="Content-Type” 
content="text/html; charset=iso-8859-1"><lf> <meta 
name="GENERATOR” content="Mozilla/4.79 [en] (Windows NT 
5.0; U) Netscape)”"><lf> <title>CMPSCI 453 / 591 / 
NTU-ST550A Spring 2005 homepage</title><lf></head><l1f> 
<much more document text following here (not shown)> 


a. HRA a HE AF NH FR BB SCP? 该 文档 提供 回答 是 什么 时 间 ? 

b. 该 文档 最 后 修改 是 什么 时 间 ? 

e 文档 中 被 返回 的 字 节 有 和 多少? 

d. 文档 被 返回 的 前 5 个 字 节 是 什么 ? 该 服务 需 同 意 一 条 持续 连接 吗 ? 


.获取 HTTP/1. 1 规范 (RFC 2616) 。 回 答 下 面 问 题 : 


a. 解释 在 客户 和 服务 器 之 间 用 于 指示 关闭 持续 连接 的 信 令 机 制 . 客户、 服务 器 或 两 者 都 能 发 送信 令 
通知 连接 关闭 了 吗 ? 

b. HTTP 提供 了 什么 加 密 服务 ? 

c. 一 个 客户 能 够 与 一 个 给 定 的 服务 器 打开 3 条 或 更 多 条 并 发 连接 吗 ? 

d. 如 果 一 个 服务 需 或 一 个 客户 检测 到 连接 已 经 空闲 一 段 时 间 ， 该 服务 器 或 客户 可 以 关 财 两 者 之 问 的 
传输 连接 ， 一 侧 开 始 关闭 连接 而 另 一 侧 通 过 该 连接 传输 数据 是 可 能 的 吗 ?” 请 解释 . 


. 假定 你 在 浏览 融 中 点 击 一 条 超 链接 获得 Web 页 面 。 相 关联 的 URL 的 IP 地址 没有 缓存 在 本 地 主机 上 ， 


因此 必须 使 用 DNS lookup 以 获得 该 Hbhko WMR EULA DNS 得 到 IP 地 址 之 前 已 经 访问 了 nn 个 DNS 
服务 器 ; 相继 产生 的 RTT 依次 为 RTT, 、…、RTT,。 进 一 步 假 定 与 链 路 相关 的 Web 页 面 只 包 售 一 个 
对 象 ， 即 由 少量 的 HTML 文本 组 成 。 令 RT, 表示 本 地 主机 和 包含 对 象 的 服务 冀 之 间 的 RTT 值 。 假定 
沪 对 象 传输 时 间 为 过 ， 则 从 客户 点 击 该 超 链接 到 它 接 收 到 该 对 象 再 要 多 长 时 间 ? 


. 参照 习题 P ， 假 定 在 同一 服务 器 上 茶 HTML 文件 引用 了 8 个 非常 小 的 对 象 。 忽 略 发 送 时 间 ， 在 下 列 


情况 下 需要 多 长 时 间 

a. 没有 并 行 TCP 连接 的 非 持 续 HTTP. 
b 配置 有 5 个 并 行 连接 的 非 持续 HTTP, 
c. 持续 HTTP, 


. 考虑 图 2-12， 其 中 有 一 个 机 构 的 网 络 和 因特网 相连 。 假 定 对 象 的 平均 长 度 为 850 000 比特 ， 从 这 个 机 


构 网 的 浏览 桌 到 初始 服务 器 的 平均 请 求 率 是 每 秒 16 个 请 求 。 还 假定 从 接 和 人 链 路 的 因特网 一 侧 的 路 由 

器 转发 一 个 HTTP 请 求 开始 ， 到 接收 到 其 响应 的 平均 时 间 是 3 秒 (参见 2.2.5 节 )。 将 总 的 平均 响应 

时 间 建 模 为 平均 接 入 时 延 ( 即 从 因特网 路 由 器 到 机 构 路 由 器 的 时 延 ) 和 平均 因特网 时 延 之 和 。 对 于 

平均 接 入 时 延 ， 使 用 A/(1 - AB), 式 中 A 是 跨越 接 人 链 路 发 送 一 个 对 象 的 平均 时 间 .，B 是 对 象 对 该 

接 入 链 路 的 平均 到 达 率 . 

a. 求 出 总 的 平均 啊 应 时 间 。 

b. 现在 假定 在 这 个 机 构 LAN 中 安装 了 一 个 缓存 器 。 假 定 命中 率 为 0.4， 求 出 总 的 响应 时 间 

考虑 一 条 10 米 短 链 路 ， 某 发 送 方 经 过 它 能 够 以 150bps 速率 双向 传输 。 假 定 包 含 数据 的 分 组 是 

100 000 比 特长 ， 仅 包含 控制 ( 如 ACK 或 握手 ) 的 分 组 是 200 比特 长 。 假 定 N 个 并 行 连接 每 个 都 获 

得 1N 的 链 路 带宽 。 现 在 考虑 HTTP 协议 ， 并 且 假 定 每 个 下 载 对 象 是 100Kb 长 ， 这 些 初 始 下 载 对 象 

包含 10 个 来 自 相 同 发 送 方 的 引用 对 象 。 在 这 种 情况 下 ， 经 非 持 续 HTTP 的 并 行 实例 的 并 行 下 载 有 意 

义 吗 ? 现在 考虑 持续 HTTP。 你 期 得 这 比 非 持续 的 情况 有 很 大 增益 吗 ” 评 价 并 解释 你 的 答案 。 

考虑 在 前 一 个 习题 中 引出 的 情况 。 现 在 假定 该 链 路 由 Bob 和 4 个 其 他 用 户 所 共享 。Bob 使 用 非 持 续 

HTTP 的 并 行 实例 ， 而 其 他 4 个 用 户 使 用 无 并 行 下 载 的 非 持续 HTTP. 

a. Bob 的 并 行 连接 能 够 帮助 他 更 快 地 得 到 Web 页 面 吗 ? 

b 如果 所 有 5 个 用 户 打 开 S 个 非 持 续 HTTP 并 行 实例 ， 那 么 Bob 的 并 行 连接 仍 将 是 有 益 的 吗 ” 为 
什么 ? 
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写 一 个 简单 的 TCP 程序 ， 使 服务 器 接收 来 自 客户 的 行 并 将 其 打印 在 服务 器 的 标准 输出 上 。( 可 以 通 
过 修改 本 书 中 的 TCPServer. py 程序 实现 上 述 任 务 -) 编译 并 执行 你 的 程序 .在 另 一 台 有 浏览 器 的 机 
器 上 ， 设 置 浏览 器 的 代理 服务 器 为 你 正在 运行 服务 器 程序 的 机 器 ， 同 时 适当 地 配置 端口 号 。 这 时 你 
的 浏览 带 问 服务 幽 发 送 GET 请 求 报 文 ， 你 的 服务 规 应 当 在 其 标准 输出 上 显示 该 报 文 。 使 用 这 个 平 

来 确定 你 的 浏览 器 是 否 对 本 地 缓存 的 对 象 产生 了 条 件 GET RX. 

SMTP 中 的 MAIL FROM 与 该 邮件 报 文 自身 中 的 From: 之 间 有 什么 不 同 ? 

SMTP 是 怎样 标识 一 个 报 文体 结束 的 ? HTTP 是 怎样 做 的 呢 ? HTTP 能 够 使 用 与 SMTP 标识 一 个 报 文 
体 结束 相同 的 方法 吗 ?” 试 解释 。 

阅读 用 于 SMTP 的 RFC 5321, MTA 代表 什么 ? 考虑 下 面 收 到 的 垃圾 邮件 (从 一 份 真实 垃圾 邮件 修改 
得 到 ) 。 假 定 这 封 垃 圾 邮件 的 唯一 始 作 傅 者 是 malacious， 而 其 他 主机 是 诚实 的 ， 指 出 是 该 malacious 
主机 产生 了 这 封 垃圾 邮件 . 

From - Fri Nov 07 13:41:30 2008 

Return-Path: <tennis5@pp33head.com> 

Received: from barmail.cs.umass.edu 

(barmail.cs.umass.edu [128.119.240.3]) by cs.umass.edu 

(8.13.1/8.12.6) for <hg@cs.umass.edu>; Fri, 7 Nov 2008 

13:27:10 -0500 

Received: from asusus-4b96 (localhost [127.0.0.1]) by 

barmail.cs.umass.edu (Spam Firewall) for 

<hg@cs.umass.edu>; Fri, 7 Nov 2008 13:27:07 -0500 

(EST) 

Received: from asusus-4b96 ([58.88.21.177]) by 

barmail.cs.umass.edu for <hg@cs.umass.edu>; Fri, 

07 Nov 2008 13:27:07 -0500 (EST) 

Received: from [58.88.21.177] by 

inbnd55.exchangeddd.com; Sat, 8 Nov 2008 01:27:07 +0700 

From: "Jonny" <tennisS@pp33head.com> 


To: <hg@cs.umass.edu> 
Subject: How to secure your savings 


阅读 POP3 AY RFC, BI] RFC 1939. UIDL POP3 命令 的 目的 是 什么 ? 

考虑 用 POP3 访问 你 的 电子 邮件 。 

a 假定 你 已 经 配置 以 下 载 并 删除 模式 运行 的 POP 邮件 客户 。 完 成 下 列 事务 : 
> Tist 


1 498 
2 912 


: retr 1 
blah blah ... 
a sa ta a rb sie blah 


SUP SI eee GO 


? 


b. 假定 你 已 经 配置 以 下 载 并 保持 模式 运行 的 POP 邮件 客户 。 完 成 下 列 事务 : 
Cs list 
S: 1 498 
S: 2 912 


C: retr 1 
S: blah blah ... 
SA mara anki acess blah 


c. 假定 你 已 经 配置 以 下 载 并 保持 模式 运行 的 POP 邮件 客户 。 使 用 (b) 中 的 记录 ， 假 定 你 检索 报 文 
1 和 2， en POP, 5 分 钟 以 后 ， 你 再 访问 POP 以 检索 新 电子 邮件 。 假 定 在 这 5 分 钟 间 隔 内 ， 没 
有 新 报 文 发 送 给 你 。 给 出 第 二 种 POP 会 话 的 记录 。 
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P18. 如 题 : 

a. 什么 是 whois KEJE? 

b. 使 用 因特网 上 的 各 种 whois 数据 库 ， 获 得 两 台 DNS 服务 器 的 名 字 。 指出 你 使 用 的 是 哪个 whois 数 
据 库 ， 

c、 你 本 地 机 器 上 使 用 nslookup m) 3 台 DNS 服务 器 发 送 DNS 查询 : 你 的 本 地 DNS 服务 带 和 两 台 你 在 
(b) 中 发 现 的 DNS IRI Ake ERRA A, NS 和 MX 报告 进行 查询 。 总 结 你 的 发 现 。 

d. 使 用 nslookup 找 出 一 台 县 有 多 个 P 地 址 的 Web 服务 需 。 你 所 在 的 机 构 (学 校 或 公司 ) 的 Web 服 
务 胡 具有 多 个 IP 地 址 吗 ? 

e. 使 用 ARIN whois 数据 库 ， 人 确定 你 所 在 大 学 使 用 的 IP Hk yt l 

f 描述 一 个 攻击 者 在 发 动 攻击 前 ， 能 够 怎样 利用 whois 数据 库 和 nslookup 工具 来 执行 对 一 个 机 构 的 侦察 。 

8- 讨论 为 什么 whois 数据 库 应 当 为 公众 所 用 。 

P19. 在 本 习题 中 ,我 们 使 用 在 Unix 和 Linux 主机 上 可 用 的 dig 工具 来 探索 DNS 服务 硕 的 等 级 结构 。 2-21 
Bhat. FE DNS 等 级 结构 中 较 高 的 DNS 服务 器 授权 对 该 等 级 结构 中 较 低 DNS FR ae DNS 请 求 ， 这 
Feit Ih] DNS 客户 发 送 回 那 台 较 低 层次 的 DNS 服务 需 的 名 字 来 实现 的 。 先 阅读 dig 的 帮助 页 ， 冉 回 
答 下 列 问 题 ， 

a. A— RAR DNS 服务 部 (MARIRI At la-m |.root-server.net 之 一 ) 开始 ， 通 过 使 用 dig 得 到 你 所 在 
系 的 Web IKI atl) 下 地 址 .发 起 一 系列 查询 。 显 示 回 答 你 的 查询 的 授权 链 中 的 DNS 服务 硕 的 名 
字 列 表 。 

b， 对 几 个 流行 Web 站 点 如 google. com, yahoo. com 或 amazon. com ， 重 复 上 一 小 题 。 

P20. 假定 你 能 够 访问 所 在 系 的 本 地 DNS 服务 融 中 的 缓存 。 你 能 够 提出 一 种 方法 来 粗略 地 确定 在 你 所 在 系 
的 用 户 中 最 为 流行 的 Web IRA Aè (你 所 在 系 以 外 ) 吗 ? 解释 原因 

P21. 假设 你 所 在 系 具 有 一 台 用 于 系 里 所 有 计算 机 的 本 地 DNS 服务 器 。 你 是 普通 用 户 〈 即 你 不 是 网 络 / 系 
统管 理 员 ) 。 你 能 够 确定 是 否 在 几 秒 钟 前 从 你 系 里 的 一 台 计 算 机 可 能 访问 过 一 台 外 部 Web 站 点 吗 ? 
解释 原因 

P22. 考虑 加 NN 个 对 等 方 分 发 局 =15Gb 的 一 个 文件 。 该 服务 器 具有 u, =30Mbps 的 上 载 速 率 ， 每 个 对 等 方 
HÆ d, =2Mbps 的 下 载 速率 和 上 载 速率 uu。 对 于 N=10、100 和 1000 并 且 u =300kbps, 700kbps 和 
2Mbps， 对 于 和 4 的 每 种 组 合 绘 制 出 确定 最 小 分 发 时 间 的 图 表 。 需 要 分 别针 对 客户 -服务 高 分 发 
和 P2P 分 发 两 种 情况 制作 ; 

P23. 考虑 使 用 一 种 客户 -服务 器 体系 结构 癌 AN 个 对 等 方 分 发 一 个 下 比特 的 文件 。 假 定 一 种 流体 模型 ， 即 某 
服务 天 能 够 同时 向 多 个 对 等 方 传输 ， 只 要 组 合 速率 不 超过 尺 ， 则 以 不 同 的 速率 向 每 个 对 等 方 传输 。 

a. 假定 uAN<d,;,,。 定 义 一 个 具有 NF/u, 分 发 时 间 的 分 发 方案 。 

b. 假定 u/NZNdiino 定义 一 个 具有 Rd 分 发 时 间 的 分 发 方 案 。 

c 得 出 最 小 分 发 时 间 通 常 是 由 max | NF/u,, Fdan! 所 决定 的 结论 。 

P24. 考虑 使 用 P2P 体系 结构 向 个 用 户 分 发 让 比特 的 一 个 文件 。 假 定 一 种 流体 模型 。 为 了 简化 起 见 ， 假 
E di 很 大 ， 因 此 对 等 方 下 载 市 宽 不 会 成 为 瓶 山 。 

a. RE u, S (u, tu, +… +un)AN。 定 义 一 个 具有 Fu, 分 发 时 间 的 分 发 方案 。 

b. 假定 & 三 (& tu, + tuy)/N, 定义 一 个 具有 NF/(u, tu, +… tuy) 分 发 时 间 的 分 发 方案 。 

c 得 出 最 小 分 发 时 间 通 常 是 由 max | F/u,, NF/ (u, +u, +--+ tuy)! 所 决定 的 结论 。 

P25. 考虑 在 一 个 有 N 个 活跃 对 等 方 的 柳 盖 网 络 中 ， 每 对 对 每 方 有 一 条 活跃 的 TCP 连接 。 此 外 ,假定 该 
TCP 连接 通过 总 共 必 台 路 由 细 。 在 对 应 的 窗 盖 网 络 中 ， 有 和 多少 结 点 和 边 ? 

P26. 假定 Bob 加 入 BitTorrent， 但 他 不 希望 向 任何 其 他 对 等 方 上 载 任何 数据 ( 因此 称 为 搭便 车 )， 


a. Bob 声称 他 能 够 收 到 由 该 社区 共享 的 某 文件 的 完整 副本 。Bob 所 言 是 可 能 的 吗 ? 为 什么 ? 
b. Bob 进一步 声称 他 还 能 够 更 为 有 效 地 进行 他 的 “搭便 车 "方法 是 利用 所 在 系 的 计算 机 实验 室 中 
的 多 台 计算 机 (具有 不 同 的 IP 地址 )。 他 怎样 才能 做 到 这 些 呢 ? 
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P27. 在 2.6.2 节 的 环形 DHT 例子 中 ， 假 定 对 等 方 3 知道 对 等 方 5 已 经 离开 。 对 每 方 3 如 何 更 新 它 的 后 继 
状态 信息 ”此 时 哪个 对 等 方 是 它 的 第 一 个 后 继 ? 哪个 是 其 第 二 个 后 继 ? 

P28. 在 2.6.2 节 的 环形 DHT 例子 中 ,假定 一 个 新 的 对 等 方 6 要 接 入 该 DHT， 并 且 对 等 方 6 最 初 只 知道 对 
Hy 1S 的 IP sh. mi BER Ap te gR? 

P29. 因为 一 个 位 于 [0, 2" -1) 的 整数 能 被 标识 为 一 个 在 DHT 中 的 比特 的 二 进 制 数 ， 每 个 键 能 被 表 
示 为 k=( 刀 ，k1，…，k,_1)， 并 且 每 个 对 等 方 标识 符 能 被 表示 为 p= (po, Po s Pa) > 我们 现 
在 定义 键 上 和 对 等 方 p 的 异 或 (XOR) 距离 为 


n-i 
d(k,p) = > | k, — P; | 2’ 
ie 
描述 该 度量 如 何 用 于 为 对 等 方 分 配 ( 键 ， 值 ) 对 。( 要 学 习 如 何 使 用 这 个 天 然 的 度量 构建 有 效 
和 的 DHT， 参 见 描 述 Kademlia DHT 的 文献 | Maymounkov 2002 | - ) 
P30. 由 于 DHT 是 覆盖 网 络 ， 它 们 也 许 不 必 与 底层 的 物理 网 络 匹配 得 很 好 ， 即 两 个 相 邻 的 对 等 方 也 许 物 
理 上 相距 很 远 ; 例如 ， 一 个 对 等 方 可 能 位 于 亚洲 而 它 的 邻居 可 能 位 于 北美 ， 如 果 我 们 随机 并 统一 地 
为 新 加 入 的 对 等 方 分 配 标识 符 ， 这 个 分 配方 案 将 会 引起 这 种 误 匹 配 吗 ? 揭示 原因 。 这 种 误 匹 配 如 何 
影响 DHT 的 性 能 呢 ? 
P31. 在 一 台 主 机 上 安装 编译 TCPClient 和 UDPClient Python 程序 ,在 另 一 台 主 机 上 安装 编 境 TCPServer 和 
UDPServer 程序 . 
a 如果 你 在 运行 TCPServer 之 前 运行 TCPClient， 将 发 生 什 么 现象 ”为 什么 ? 
b. 如果 你 在 运行 UDPServer 之 前 运行 UDPClient， 将 发 生 什 么 现象 ”为 什么 ? 
c 如 果 你 对 客户 端 和 服务 器 端 使 用 了 不 同 的 端口 ， 将 发 生 什么 现象 ? 
P32. 假定 在 UDPClient py 中 在 创建 套 接 字 后 增加 了 下 面 一 行 : 
clientSocket.bind(('', 5432)) 
有 必要 修改 UDPServer. py 吗 ? UDPClient 和 UDPServer 中 的 套 接 字 端 口号 是 多 少 ” 在 变化 之 前 它们 是 


多 少 ? 
P33， 你 能 够 配置 浏览 器 以 打开 对 某 Web 站 点 的 多 个 并 行 连接 吗 ? 有 大 量 的 并 行 TCP 连接 的 优点 和 缺点 


是 什么 

P34. 我 们 已 经 看 到 因特网 TCP 套 接 字 将 数据 处 理 为 字 节 流 ， 而 UDP 套 接 字 识别 报 文 边界 。 面 回 字 节 API 
与 显 式 识别 和 维护 应 用 程序 定义 的 报 文 边界 的 API 相 比 ， 试 给 出 一 个 优点 和 一 个 缺点 。 

P35. 什么 是 Apache Web 服务 器 ? 它 值 多 少 钱 ? 它 当 前 有 多 少 功能 ? 为 回答 这 个 问题 ， 你 也 许 要 看 一 下 
维基 百科 。 

P36. 许多 BitTorrent 客户 使 用 DHT 来 创建 一 个 分 布 式 跟踪 器 。 对 于 这 些 DHT, “ 键 ” 是 什么 ,“ 值 ”是 
什么 ? 


SZ 套 接 字 编程 作业 

配套 Web 网 站 包括 了 6 个 套 接 字 编程 作业 。 前 四 个 作业 简 述 如 下 . 第 5 个 作业 利用 了 ICMP 协议 ， 
在 第 4 章 结尾 简 述 。 第 6 个 作业 使 用 了 多 媒体 协议 ， 在 第 7 章 结 尾 简 述 。 极 力 推荐 学 生 们 完成 这 些 作 业 
中 的 几 个 〈 如 果 不 是 全 部 的 话 ) 。 学 生 们 能 够 在 Web 网 站 http://www. awl. com/kurose- ross 上 找到 这 些 作 
业 的 全 面 细节 ， 以 及 Python 代码 的 重要 片段 。 

作业 1: Web 服务 器 

在 这 个 编程 作业 中 ， 你 将 用 Python 语言 开发 一 个 简单 的 Web 服务 器 ， 它 仅 能 处 理 一 个 请 求 。 具 体 而 
言 ， 你 的 Web 服务 器 将 : (1) 当 一 个 客户 (浏览 器 ) 联系 时 创建 一 个 连接 套 接 字 ; (2) 从 这 个 连接 接 
收 HTTP 请 求 ; (3) 解释 该 请 求 以 确定 所 请 求 的 特定 文件 ; (4) 从 服务 器 的 文件 系统 获得 请 求 的 文件 ; 
(5) 创建 一 个 由 请 求 的 文件 组 成 的 HTTP 响应 报 文 ， 报 文 前 面 有 首部 行 ; (6) 经 TCP 连接 向 请 求 的 浏览 











fie AC IK Ma UMRA ME A R IEIZ SF a PAS FE EY CHE, iA a 8 [a] 4 “404 Not Found” 
差错 报 文 

在 配套 网 站 中 ,我 们 提供 了 用 于 该 服务 器 的 框架 代码 .你 的 任务 是 完善 该 代码 ， 运 行 服务 器 ， 通 过 
在 不 同 主 机 上 运行 的 浏览 器 发 送 请 求 来 测试 该 服务 器 。 如 果 运 行 你 服务 器 的 主机 上 已 经 有 一 个 Web 服务 
人 在 运行 ， 你 应 当 为 该 Web 服务 硕 使 用 一 个 不 同 于 80 端口 的 其 他 端口 

作业 2: UDP ping 程序 

在 这 个 编程 作业 中 ， 你 将 用 Python 编写 一 个 客户 ping 程序 。 该 客户 将 发 送 一 个 简单 的 ping 报 文 ， 接 
收 一 个 从 服务 融 返 回 的 对 应 pong 报 文 ， 并 确定 从 该 客户 发 送 ping 报 文 到 接收 到 pong 报 文 为 止 的 时 延 . 
该 时 延 称 为 往返 时 延 (RTT). 由 该 客户 和 服务 器 提供 的 功能 类 似 于 在 现代 操作 系统 中 可 用 的 标准 ping F 
序 。 然而， 标准 的 ping 使 用 互联 网 控制 报 文 协 议 (ICMP) (我 们 将 在 第 4 章 中 学 习 1ICMP) .此 时 我 们 将 
创建 一 个 非 标 准 (但 简单 ) 的 基于 UDP 的 ping 程序 ， 

你 的 ping 程序 经 UDP 问 目标 服务 器 发 送 10 个 ping 报 文 ， 对 于 每 个 报 文 ， 当 对 应 的 pong 报 文 返回 
于， 你 的 客户 要 确定 和 打印 RTT. 因为 UDP 是 一 个 不 可 靠 的 协议 ， 由 客户 发 送 的 分 组 可 能 会 王 失 ， 为 
此 ， 客 户 不 能 无 限期 地 等 待 对 ping 报 文 的 回答 ,客户 等 待 服务 融 回 答 的 时 间 至 多 为 1 秒 ;， 如 果 没 有 收 到 
回答 ， 客 户 假定 该 分 组 丢失 并 相应 地 打印 一 条 报 文 。 

在 此 作业 中 ， 将 给 出 服务 器 的 完整 代码 〈 在 配套 网 站 中 可 找到 )， 你 的 任务 是 编写 客户 代 僻 ， 该 代 
ESIE AREK KS 建议 你 先 仔 细 学 习 服 务 器 的 代码 ， 然 后 编写 你 的 客户 代码 ， 可 以 不 受 限 制 地 
从 服务 奉 代 码 中 剪贴 代码 行 。 

作业 3: 邮件 客户 

这 个 编程 作业 的 日 的 是 创建 一 个 向 任何 接收 方 改 送 电 子 邮件 的 简单 邮件 客户 。 你 的 客户 将 必须 与 邮件 
服务 器 (如 谷歌 的 电子 邮件 服务 严 ) 创建 一 个 TCP 连接 ， 使 用 SMTP 协 以 与 邮件 服务 货 进 行 交 谈 ， 经 该 邮 
PEARS aie] ERMC CAN AC) 发 送 一 个 电子 邮件 报 文 ， 最 后 关闭 与 该 邮件 服务 器 的 TCP 连接 

对 本 作业 ， 配 套 Web 站 点 为 你 的 客户 提供 了 框架 代码 .你 的 任务 是 完善 该 代码 并 通过 向 不 同 的 用 户 
账户 发 送 电 子 邮 件 来 测试 你 的 客户 。 你 也 可 以 尝试 通过 不 同 的 服务 右 〈 例 如 谷歌 的 邮件 服务 器 和 你 所 在 
大 学 的 邮件 服务 部 ) 进行 发 送 . 

作业 4: 多 线程 Web 代理 服务 器 

在 这 个 编程 作业 中 ， 你 将 研发 一 个 简单 的 Web 代理 服务 器 。 当 你 的 代理 服务 器 从 一 个 浏览 器 接收 到 
对 某 对 象 的 HTTP RER, 它 生 成 对 相同 对 象 的 一 个 新 HTTP 请 求 并 向 初始 服务 器 发 送 。 当 该 代理 从 初始 服 
务 硕 接收 到 具有 该 对 象 的 HTTP 响应 时 ， 它 生成 一 个 包括 该 对 象 的 新 HTTP 响应 ， 并 发 送 给 该 客户 ， 这 个 
代理 将 是 多 线程 的 ， 使 其 在 相同 时 间 能 够 处 理 多 个 请 求 。 

对 本 作业 而 言 ， 配 套 Web 网 站 对 该 代理 服务 占 提 供 了 框架 代码 。 你 的 任务 是 完善 该 代码 ， 然 后 测试 
你 的 代理 ， 方 法 是 让 不 同 的 浏览 右 经 过 你 的 代理 来 请 求 Web 对 象 . 


E v Wireshark 实验 : ATIP 


在 实验 1 中 ,我 们 已 经 初步 使 用 了 Wireshark 分 组 嗅 探 器 ， 我 们 现在 准备 使 用 Wireshark 来 研究 运行 
中 的 协议 。 在 本 实验 中 ， 我 们 将 研究 HTTP 协议 的 几 个 方面 : 基本 的 GET 回答 交互 ，HTTP 报 文 格式 ， 
检索 大 HTML Xit, RRRA ANH URL 的 HTML 文件 ， 持 续 和 非 持续 连接 ，HTTP 鉴别 和 安全 性 ， 

如 同上 所 有 的 Wireshark 实验 一 样 ， 对 该 实验 的 全 面 描 述 可 查阅 本 书 的 Web 站 点 hitp://www. awl. com/ 


kurose- ross - 


制 Wireshark 实验 : DNS 
在 本 实验 中 ， 我 们 仔细 观察 DNS 的 客户 端 (DNS 是 用 于 将 因特网 主机 名 转换 为 IP 地 址 的 协议 ). 
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2.5 节 讲 过 ， 在 DNS 的 客户 角色 是 相当 简单 的 : 客户 向 它 的 本 地 DNS 服务 器 发 送 一 个 请 求 ， 并 接收 返 四 
的 啊 应 。 在 此 过 程 中 发 生 的 很 多 事情 均 不 为 DNS 客户 所 见 ， 如 等 级 结构 的 DNS 服务 天 互相 通信 递归 地 或 
迭代 地 解析 该 客户 的 DNS 请 求 。 然 而 ， 从 DNS 客户 的 角度 而 言 ， 该 协议 是 相当 简单 的 ， 即 向 本 地 DNS 
服务 器 发 送 一 个 请 求 ， 从 该 服务 器 接收 一 个 啊 应 。 在 本 实验 中 我 们 观察 运转 中 的 DNS. 

如 同 所 有 的 Wireshark 实验 一 样 ， 在 本 书 的 Web 站 点 http://www. awl. com/kurose- ross 可 以 找到 本 实 
验 的 完整 描述 。 


Mare Andreessen 是 Mosaic 的 共同 发 明 人 ，Mosaic 是 一 种 Web 浏览 器 ， 正 
是 它 使 万 维 网 在 1993 Fis eK. Mosaic 具有 一 个 清晰 、 易 于 理解 的 界面 ， 是 
首 个 能 内 在 文本 中 显示 图 像 的 浏览 器 。 在 1994 年 ，Marc Andreessen 和 Jim Clark 
创办 了 Netscape 公司 ， 其 浏览 器 是 到 20 世纪 90 年 代 中 期 为 止 最 为 流行 的 ， 
Netscape 也 研发 了 安全 套 接 字 层 (SSL) 协议 和 许多 因特网 服务 器 产品 ， 和 包括 
邮件 服务 器 和 基于 SSL 的 Web 服务 器 。 他 现在 是 风险 投资 公司 Andreessen 
Horowitz 的 共同 商 基 人 和 一 般 股 东 ， 对 包括 Facebook, Foursquare, Groupon, 
Jawbone 、Twitter 和 Zynga 等 公司 的 财产 投资 搭配 进行 监管 。 他 服务 于 包括 Marc Andreessen 
Bump, eBay, Glam Media, Facebook 和 HP 等 在 内 的 多 个 董事 会 。 他 具有 美国 
伊利 诺 伊 大 学 厄 巴 纳 -香槟 分 校 的 计算 机 科学 理学 学 士 学 位 - 
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。 您 是 怎样 变 得 对 计算 感 兴 趣 的 ”您 过 去 一 直 知 道 您 要 从 事 信 息 技术 吗 ? 

在 我 长 大 成 人 的 过 程 中 ， 视 频 游 戏 和 个 人 计算 正好 成 为 成 功 而 风行 一 时 的 事物 ， 在 20 世纪 70 年 代 后 
期 和 80 年 代 初 期 , 个 人 计算 成 为 了 新 技术 发 展 前 沿 。 那 时 不 只 有 苹果 和 1BM 的 个 人 计算 机 ， 而 且 有 如 
Commodore I Atari 等 数 以 百 计 的 新 公司 。 我 在 10 岁 时 用 一 本 名 为 《简明 BASIC 速成 》 (Instant Freeze- 
Dried BASIC) 的 书 进行 自学 ， 并 在 12 岁 时 得 到 上 自己 的 第 一 台 计 算 机 (TRS-80 Color Computer, EAE!) 

。 请 描述 您 职业 生涯 中 干 过 的 最 令 人 激动 的 一 两 个 项 目 。 最 大 的 挑战 是 什么 ? 

组 良 置 疑 ， 最 令 人 兴奋 的 项 目 是 1992 ~ 1993 年 的 初始 Mosaic Web 浏览 项 ， 最 大 的 挑战 是 让 任何 人 从 
此 往 后 都 认真 地 对 待 它 。 在 那个 时 候 ， 每 个 人 都 认为 交互 式 未 来 将 是 由 大 型 公司 宣布 的 “交互 式 电视 ”， 
而 韭 由 新 兴 公 司 发 明 的 因特网 。 

。 您 对 网 络 和 因特网 未 来 的 什么 东西 感到 兴奋 ?您 最 为 关注 什么 ? 

最 为 兴奋 的 东西 是 程序 员 和 企业 家 能 够 开发 的 应 用 和 服务 的 巨大 的 尚 待 开发 的 领域 ， 即 因特网 已 经 
释放 的 创造 性 到 达 了 一 种 我 们 以 前 从 未 预见 到 的 水 平 。 我 最 关注 是 “ 意 想不到 的 后 果 ” 的 原则 ， 即 我 们 
并 不 总 是 知道 我 们 所 做 事情 的 后 果 ， 例 如 因特网 被 政府 所 用 ， 使 得 监视 居民 到 达 了 一 种 新 水 平 . 

© HZ Web 技术 的 进展 ， 学 生 们 有 什么 应 当 特 别 要 了 解 的 ? 

改变 的 速度 ， 即 对 学 习 来 说 ， 最 重要 的 东西 是 学 习 的 方法 ， 在 特定 的 技术 中 如 何 灵 活 地 适应 改变 ， 
当 你 在 职业 生涯 中 前 行 时 ， 在 新 的 机 会 和 可 能 性 方面 如 何 保持 开放 的 思想 。 

© 什么 人 给 予 您 专业 灵感 ? 

他 们 是 : Vannevar Bush, Ted Nelson, Doug Engelgart, Nolan Bushnell, Bill Hewlett 和 Dave Packard, Ken 
Olsen, Steve Jobs, Steve Wozniak, Andy Grove, Grace Hopper, Hedy Lamarr, Alan Turing, Richard Stallman. 

e 对 于 要 在 计算 和 信息 技术 领域 谋求 发 展 的 学 生 们 ， 您 有 什么 忠告 ? 

尽 可 能 深入 地 理解 技术 是 怎样 创造 的 ， 然 后 补充 学 习 商 业 运 作 的 原理 ， 

o 技术 能 够 解决 世界 的 问题 吗 ? 

不 能 ， 但 是 通过 经 济 增长 我 们 推动 人 们 生活 标准 的 改善 。 综 观 历 史 ， 大 多 数 经 济 增长 来 目 技术 ， 央 
此 就 像 技 术 带 来 的 好 处 一 样 . 
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运输 层 位 于 应 用 层 和 网 络 层 之 则 ， 是 分 层 的 网 络 体系 结构 的 重要 部 分 。 该 层 为 运行 在 
不 同 主机 上 的 应 用 进程 提供 直接 的 通信 服务 起 着 至 关 重 要 的 作用 。 我 们 在 本 曹 采用 的 教学 
方法 是 ， 交 替 地 讨论 运输 层 的 原理 和 这 些 原理 在 现 有 的 协议 中 是 如 何 实现 的 。 与 往常 一 
样 ， 我 们 将 特别 关注 因特网 协议 ， 即 TCP 和 UDP 运输 层 协议 。 

我 们 将 从 讨论 运输 层 和 网 络 层 的 关系 开始 。 这 就 进入 了 研究 运输 层 第 一 个 关键 功 能 的 
阶段 ， 凤 将 网 络 层 的 在 两 个 端 系统 之 间 的 交付 服务 扩展 到 运行 在 两 个 不 同 端 系统 上 的 应 用 
层 进 程 之 问 的 交付 服务 。 我 们 将 在 讨论 因特网 的 无 连接 运输 协议 UDP 时 阐述 这 个 功能 。 

然后 我 们 重新 回 到 原理 学 习 上 ， 面 对 计算 机 网 络 中 最 为 基础 性 的 问题 之 一 ， 即 两 个 实 
体 怎 样 才能 在 一 种 会 丢失 或 损坏 数据 的 媒体 上 可 靠 地 通信 。 通 过 一 系列 复 傈 性 不 断 增 加 
(从 而 更 真实 !) 的 情况 ， 我 们 将 逐步 建立 起 一 套 被 运输 协议 用 来 解决 这 些 问 题 的 技术 。 然 
后 ,我 们 将 说 明 这 些 原理 是 如 何 体现 在 因特网 面向 连接 的 运输 协议 TCP 中 的 。 

接 下 来 我 们 讨论 网 络 中 的 第 二 个 基础 性 的 重要 问题 ， 即 控制 运输 层 实体 的 传输 速率 以 
避免 网 络 中 的 拥塞 ， 或 从 拥塞 中 恢复 过 来 。 我 们 将 考虑 拥塞 的 原因 和 后 采 ， 以 及 贡 用 的 拥 
塞 控 制 技 术 。 在 透彻 地 理解 了 拥塞 控制 问题 之 后 ， 我 们 将 研究 TCP 的 拥塞 控制 方法 。 


3. 1 概述 和 运输 层 服务 


在 前 两 章 中 ， 我 们 已 对 运输 层 的 作用 及 其 所 提供 的 服务 有 所 了 解 。 现 在 我 们 快速 地 回 
顾 一 下 前 面 学 过 的 有 关 运 输 层 的 知识 。 

运输 层 协议 为 运行 在 不 同 主机 上 的 应 用 进程 之 间 提 供 了 逻辑 通信 (logic communication ) 
功能 。 从 应 用 程序 的 角度 看 ， 通 过 逻辑 通信 ， 运 行 不 同 进程 的 主机 好 像 直 接 相 连 一 样 ， 实 
际 上 ， 这 些 主机 也 许 位 于 地 球 的 两 侧 ， 通 过 很 多 路 由 器 及 多 种 不 同类 型 的 链 路 相连 。 应 用 
进程 使 用 运输 层 提供 的 逻辑 通信 功能 和 披 此 发 送 报 文 ， 而 无 需 考 虑 承载 这 些 报 文 的 物理 基础 
设施 的 细节 . 图 3-1 图 示 了 逻辑 通信 的 概念 。 

如 图 3-1 所 示 ， 运 输 层 协议 是 在 端 系统 中 而 不 是 在 路 由 絮 中 实现 的 。 在 发 送 端 ， 运 输 
层 将 从 发 送 应 用 程序 进程 接收 到 的 报 文 转换 成 运输 层 分 组 ， 用 因特网 术语 来 讲 该 分 组 称 为 
运输 层 报 文 段 (segment) 。 实 现 的 方法 (可 能 ) 是 将 应 用 报 文 划 分 为 较 小 的 块 ， 并 为 每 块 
加 上 一 个 运输 层 首 部 以 生成 运输 层 报 文 段 。 然 后 ， 在 发 送 端 系统 中 ,运输 层 将 这 些 报 文 段 
传递 给 网 络 层 ， 网 路 层 将 其 封装 成 网 络 层 分 组 ( 即 数据 报 ) 并 向 目的 地 发 送 。 注 意 到 下 列 
事实 是 重要 的 : 网 络 路 由 屁 仅 作用 于 该 数据 报 的 网 络 层 字段 ， 即 它们 不 检查 封 沪 在 该 数据 
报 的 运输 层 报 文 段 的 字段 。 在 接收 端 ， 网 络 层 从 数据 报 中 提取 运输 层 报 文 段 ， 并 将 该 报 文 
段 问 上 交 给 运输 层 。 运 输 层 则 处 理 接收 到 的 报 文 段 ， 使 该 报 文 段 中 的 数据 为 接收 应 用 进程 
使 用 。 

网 络 应 用 程序 可 以 使 用 多 种 的 运输 层 协议 。 例 如 ， 因 特 网 有 两 种 协议 ， 即 TCP 和 
UDP. 每 种 协议 都 能 为 调用 的 应 用 程序 提供 一 组 不 同 的 运输 层 服务 。 
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图 3-1 运输 层 在 应 用 程序 进程 问 提供 逮 辑 的 而 非 物理 的 通信 


3.1.1 运输 层 和 网 络 层 的 关系 


前 面 讲 过 ， 在 协议 栈 中 ， 运 输 层 刚好 位 于 网 络 层 之 上 。 网 络 层 提 供 了 主机 之 间 的 逻辑 
通信 ， 而 运输 层 为 运行 在 不 同 主机 上 的 进程 之 间 提 供 了 逻辑 通信 。 这 种 差别 虽然 细微 但 很 
重要 。 我 们 用 一 个 家 庭 类 比 来 帮助 分 析 这 种 差别 。 

考虑 有 两 个 家 庭 ， 一 家 位 于 美国 东海 岸 ， 一 家 位 于 美国 西海 岸 ， 每 家 有 12 个 孩子 。 
东海 赃 家 庭 的 孩子 们 是 西海 尾 家 胜 护 子 们 的 咎 兄 第 姐妹 。 这 两 个 家 庭 的 孩子 们 喜欢 彼此 通 
信 ， 每 个 人 每 星期 要 互相 写 一 封 信 ， 每 封 信和 都 用 单独 的 信封 通过 传统 的 邮政 服务 传送 。 因 
IE, BET ARE BS Ee] 7 — AR AIK 144 封 信 。( 如果 他 们 有 电子 邮件 的 话 ， 这 些 孩 子 可 以 
省 不 少 钱 !) 每 一 个 家 庭 有 个 孩子 负责 收发 邮件 ， 西 海岸 家 庭 是 An fil AR AE Fe Bee AL Bill, 
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每 星期 An 去 她 的 所 有 兄弟 姐妹 那里 收集 信件 ， 并 将 这 些 信件 交 到 每 天 到 家 门口 来 的 邮政 
服务 的 邮 车 上 。 当 信件 到 达 西 海岸 家 庭 时 ，Ann 也 负责 将 信件 分 发 到 她 的 兄弟 姐妹 手 上 。 
在 东海 岸 家 庭 中 的 Bill 也 负责 类 似 的 工作 。 
在 这 个 例子 中 ， 邮 政 服 务 为 两 个 家 庭 间 提供 逻辑 通信 ， 邮 政 服务 将 信件 从 一 家 送 往 克 一 
家 ， 而 不 是 从 一 个 人 送 往 另 一 个 人 。 在 另 一 方面 ，Ann 和 Bill 为 蔡 兄 弟 姐 妹 之 间 提 供 了 逻辑 
通信 ，Ann 和 Bill 从 兄弟 姐妹 那里 收取 信件 或 到 兄弟 姐妹 那里 交付 信件 。 注意 到 从 笛 见 肿 姐 
妹 们 的 角度 来 看 ，Ann 和 Bill 就 是 邮件 服务 ， 尽 管 他 们 只 是 端 到 闯 交 付 过 程 的 一 部 分 〈 即 站 
系统 部 分 ) 。 在 解释 运输 层 和 网 络 层 之 间 的 关系 时 ， 这 个 家 庭 的 例子 是 一 个 非常 好 的 类 比 。 
应 用 层 报 文 = 信封 上 的 字符 
进程 = 党 兄弟 姐妹 
主机 (又 称 为 端 系统 ) = REE 
运输 层 协 议 = Ann 和 Bill 
网 络 层 协议 = 邮政 服务 (包括 邮 车 ) 
我 们 继续 观察 这 个 类 比 。 值 得 注意 的 是 ，Ann 和 Bill 都 是 在 各 自家 里 进行 工作 的 ; 例 
如 ， 他 们 并 没有 参与 任何 一 个 中 间 邮 件 中 心 对 邮件 进行 分 拣 ， 或 者 将 邮件 从 一 个 邮件 中 心 
送 到 另 一 个 邮件 中 心 之 类 的 工作 。 类 似 地 ， 运 输 层 协议 只 工作 在 端 系 统 中 。 在 端 系统 中 ， 
运输 层 协议 将 来 自 应 用 进程 的 报 文 移动 到 网 络 边缘 〈 即 网 络 层 ) ， 反 过 来 也 是 一 样 ， 但 对 
有 关 这 些 报 文 在 网 络 核心 如 何 移动 并 不 作 任 何 规定 。 事 实 上 ， 如 网 3-1 tos, Pe A at 
既 不 处 理 也 不 识别 运输 层 加 在 应 用 层 报 文 的 任何 信息 。 
我 们 还 是 继续 讨论 这 两 家 的 情况 。 现 在 假定 Ann 和 Bill 外 出 度假 ， 另 外 一 对 等 兄妹 
(如 Susan 和 Harvey) 接替 他 们 的 工作 ， 在 家 庭 内 部 进行 信件 的 收集 和 交付 工作 。 不 六 的 
f=, Susan 和 Harvey 的 收集 和 交付 工作 与 Ann 和 Bill 所 做 的 并 不 完全 一 样 。 由 于 年 龄 更 
小 ，Susan 和 Harvey 收发 邮件 的 次 数 更 少 ， 而 且 偶 尔 还 会 丢失 邮件 (有 时 是 被 家 里 的 狗 哎 
坏 了 )。 因 此 ，Susan 和 Harvey 这 对 和 党 兄妹 并 没有 提供 与 Ann 和 Bill 一 样 的 服务 集合 (B 
相同 的 服务 模型 ) 。 与 此 类 似 ， 计 算 机 网 络 中 可 以 安排 多 种 运输 层 协议 ， 每 种 协议 为 应 用 
程序 提供 不 同 的 服务 模型 。 
Ann 和 Bill 所 能 提供 的 服务 明显 受制 于 邮政 服务 所 能 提供 的 服务 。 例 如 ， 如 果 邮 政 服 
务 不 能 提供 在 两 家 之 间 传 递 邮 件 所 需 时 间 的 最 长 期 限 (例如 3 R), ALA Ann 和 Bill 就 不 
可 能 保证 邮件 在 党 兄弟 姐妹 之 间 传 递 信 件 的 最 长 期 限 。 与 此 类 似 ， 运输 协议 能 够 提供 的 服 
务 常 常 受 制 于 底层 网 络 层 协议 的 服务 模型 。 如 果 网 络 层 协议 无 法 为 主机 之 间 发 送 的 运输 层 
报 文 段 提供 时 延 或 带宽 保证 的 话 ， 运 输 层 协议 也 就 无 法 为 进程 之 间 发 送 的 应 用 程序 报 文 提 
供 时 延 或 市 宽 保证 。 
然而 ， 即 使 底层 网 络 协议 不 能 在 网 络 层 提供 相应 的 服务 ， 运 输 层 协议 也 能 提供 某 些 服 
务 。 例 如 ， 如 我 们 将 在 本 章 所 见 ， 即 使 底层 网 络 协 议 是 不 可 徘 的 ， 也 就 是 说 网 络 层 协议 会 
使 分 组 丢失 、 算 改 和 元 余 ， 运输 协议 也 能 为 应 用 程序 提供 可 徘 的 数据 传输 服务 。 为 一 个 例 
子 是 (我 们 在 第 8 章 讨 论 网 络 安全 时 将 会 研究 到 ) ， 即 使 网 络 层 不 能 保证 运输 层 报 文 段 的 
机 密 性 ， 运 输 协 议 也 能 使 用 加 密 来 确保 应 用 程序 报 文 不 被 人 侵 者 读 取 。 


3.1.2 因特网 运输 层 概 述 
前 面 讲 过 因特网 (更 一 般 地 讲 是 一 个 TCPVIP 网 络 ) 为 应 用 层 提供 了 两 种 截然 不 同 的 
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可 用 运输 层 协 以 。 这 些 协议 一 种 是 UDP (用 户 数据 报 协议 )， 它 为 调 几 它 的 应 用 程序 提供 
了 一 种 不 可 徘 、 无 连接 的 服务 。 男 一 种 是 TCP (传输 控制 协议 )， 它 为 调用 它 的 应 用 程序 
提供 了 一 种 可 徘 的 、 面 回 连接 的 服务 。 当 设计 一 个 网 络 应 用 程序 时 ， 该 应 用 程序 的 开发 人 
员 必 ' 须 指定 使 用 这 两 种 运输 协议 中 的 哪 一 种 。 如 我 们 在 2.7 节 看 到 的 那样 ， 应 用 程序 开发 
人 员 在 生成 套 接 字 时 必须 指定 是 选择 UDP 还 是 选择 TCP 

为 了 何人 化 术语， 在 与 因特网 有 关 的 环境 中 ,我 们 将 运输 层 分 组 称 为 报 文 段 (seg- 
ment)。 然 而 ,需要 指出 的 是 ， 因 特 网 文献 (如 REC 文档 ) 也 将 TCP 的 运输 层 分 组 称 为 报 
SB, ARF UDP 的 分 组 称 为 数据 报 。 而 这 类 因特网 文献 也 将 网 络 层 分 组 称 为 数据 报 ! 
本 书 作 为 一 本 计算 机 网 络 的 入 门 书籍 ， 我 们 认为 将 TCP 和 UDP 的 分 组 统称 为 报 文 段 ， 而 
将 数据 报名 称 保留 给 网 络 层 分 组 不 容易 混 消 。 

在 对 UDP 和 TCP 进行 简要 介绍 之 前 ， 简 单 介绍 一 下 因特网 的 网 络 层 (我 们 将 在 第 4 章 
中 详细 地 学 习 网 络 层 ) 是 有 用 的 。 因 特 网 网 络 层 协议 有 一 个 名 字 叫 IP， 即 网 际 协 议 。IP 为 
主机 之 间 提 供 了 逻辑 通信 。 耳 的 服务 模型 是 尽力 而 为 交付 服务 (best-effort delivery service), 
这 意味 着 IP 尽 它 “最 大 的 努力 ”在 通信 的 主机 之 间 交 付 报 文 段 ， 但 它 并 不 做 任何 确保 。 
特别 是 ， 它 不 确保 报 文 段 的 交付 ， 不 保证 报 文 段 的 按 序 交付 ， 不 保证 报 文 段 中 数据 的 完整 
ME FAKE IIA, P Oe RR AAS BY SEARS (unreliable service). 在 此 还 要 指出 的 是 ， 每 台 
主机 至 少 有 一 个 网 络 层 地 址 ， 即 所 谓 的 下 地址。 我 们 在 第 4 章 将 详细 讨论 IP 地 址 ; 在 这 
一 草 中 ， 我 们 只 需要 记 住 每 台 主 机 有 一 个 IP 地 址 。 

在 对 IP 服务 模型 有 了 初步 了 解 后 ,我 们 总 结 一 下 UDP 和 TCP 所 提供 的 服务 模型 。 
UDP Al TCP 最 基本 的 责任 是 ,将 两 个 端 系统 间 IP 的 交付 服务 扩展 为 运行 在 端 系统 上 的 两 
个 进程 之 间 的 交付 服务 。 将 主机 间 交 付 扩展 到 进程 间 交 付 被 称 为 运输 层 的 多 路 复 用 
(transport-layer multiplexing) 与 多 路 分 解 (demultiplexing) 。 我 们 将 在 下 一 节 讨 论 运输 层 的 
多 路 复 用 与 多 路 分 解 。UDP 和 TCP 还 可 以 通过 在 其 报 文 段 首部 中 包括 差错 检查 字段 而 提 
供 完 整 性 检查 。 进 程 到 进程 的 数据 交付 和 差错 检查 是 两 种 最 低 限 度 的 运输 层 服务 ， 也 是 
UDP 所 能 提供 的 仅 有 的 两 种 服务 。 特 别 是 ， 与 耻 一 样 ，UDP 也 是 一 种 不 可 靠 的 服务 ， 即 
不 能 保证 一 个 进程 所 发 送 的 数据 能 够 完整 无 缺 地 (或 全 部 !) 到 达 目 的 进程 。 在 3.3 节 中 
将 更 详细 地 讨论 UDP. 

AA Fr fi], TCP 为 应 用 程序 提供 了 几 种 附加 服务 。 首 先 ， 它 提供 可 靠 数据 传输 (reliable 
data transfer ) o 通过 使 用 流量 控制 ~ 序号 \ WALA Ale AT A$ ( 本 草 将 详细 介绍 这 些 技术 ) ， TCP 
确保 正确 地 、 按 序 地 将 数据 从 发 送 进程 交付 给 接收 进程 。 这 样 ，TCP 就 将 两 个 端 系 统 间 的 
不 可 靠 IP 服务 转换 成 了 一 种 进程 间 的 可 靠 数据 传输 服务 。TCP 还 提供 拥塞 控制 (conges- 
tion control) 。 拥 塞 探 制 与 其 说 是 一 种 提供 给 调用 它 的 应 用 程序 的 服务 ， 不 如 说 是 一 种 提供 
给 整个 因特网 的 服务 ， 这 是 一 种 市 来 通用 好 处 的 服务 。 不 太 严 格 地 说 ，TCP 拥塞 控制 防止 
任何 一 条 TCP 连接 用 过 多 流量 来 淹没 通信 主机 之 间 的 链 路 和 交换 设备 。TCP 力求 为 每 个 通 
过 一 条 拥塞 网 络 链 路 的 连接 平等 地 共享 网 络 链 路 带宽 。 这 可 以 通过 调节 TCP 连接 的 发 送 端 
发 送 进 网 络 的 流量 速率 来 做 到 。 在 男 一 方面 ，UDP 流量 是 不 可 调节 的 。 使 用 UDP 传输 的 
应 用 程序 可 以 根据 其 需要 以 其 愿意 的 任何 速率 发 送 数据 。 

一 个 能 提供 可 靠 数 据 传输 和 拥塞 控制 的 协议 必定 是 复杂 的 。 我 们 将 用 几 节 的 篇 幅 来 介 
绍 可 靠 数据 传输 和 拥塞 控制 的 原理 ， 用 另外 几 节 介绍 TCP 协议 本 身 。3.4 ~3.8 节 将 研究 
这 些 主题 。 本 草 采 取 基 本 原理 和 TCP 协议 交替 介绍 的 方法 。 例 如 ， 我 们 首先 在 一 般 环 境 下 


wm Hw Æ 127 


讨论 可 靠 数据 传输 ， 然 后 讨论 TCP 是 怎样 具体 提供 可 靠 数 据 传输 的 。 类 似 地 ， 先 在 一 般 环 
境 下 讨论 拥塞 控制 ， 然 后 讨论 TCP 是 怎样 实现 拥塞 控制 的 。 但 在 全 面 介绍 这 些 内 容 之 前 ， 
我 们 先 学 习 运 输 层 的 多 路 复 用 与 多 路 分 解 。 


3.2 多 路 复 用 与 多 路 分 解 


在 本 节 中 ， 我 们 讨论 运输 层 的 多 路 复 用 与 多 路 分 解 ， 也 就 是 将 由 网 络 层 提供 的 主机 到 
主机 交付 服务 延伸 到 为 运行 在 主机 上 的 应 用 程序 提供 进程 到 进程 的 交付 服务 。 为 了 使 讨论 
具体 起 见 ， 我 们 将 在 因特网 环境 中 讨论 这 种 基本 的 运输 层 服 务 。 然 而 ， 需 要 强调 的 是 ， 多 
路 复 用 与 多 路 分 解 服务 是 所 有 计算 机 网 络 都 需要 的 。 

在 目的 主机 ， 运 输 层 从 紧邻 其 下 的 网 络 层 接收 报 文 段 。 运 输 层 负责 将 这 些 报 文 段 中 的 
数据 交付 给 在 主机 上 和 运行 的 适当 应 用 程序 进程 。 我 们 来 看 一 个 例子 。 假 定 你 正 坐 在 计算 机 
Hy Fak Web 页 面 ， 同 时 还 在 运行 一 个 FTP 会 话 和 两 个 Telnet 会 话 。 这 样 你 就 有 4 个 网 络 应 
用 进程 在 运行 ， 即 两 个 Telnet 进程 ， 一 个 FTP 进程 和 一 个 HTTP 进程 。 当 你 的 计算 机 中 的 
运输 层 从 底层 的 网 络 层 接收 数据 时 ， 它 需要 将 所 接收 到 的 数据 定向 到 这 4 个 进程 中 的 一 
个 。 现 在 我 们 来 研究 这 是 怎样 完成 的 。 

首先 回想 2.7 市 的 内 容 ， 一 个 进程 (作为 网 络 应 用 的 一 部 分 ) 有 一 个 或 多 个 套 接 字 
(socket) ， 它 相当 于 从 网 络 同 进程 传递 数据 和 从 进程 回 网 络 传递 数据 的 门户 。 因 此 ， 如 
图 3-2 所 示 ， 在 接收 主机 中 的 运输 层 实际 上 并 没有 直接 将 数据 交付 给 进程 ， 而 是 将 数据 交 
给 了 一 个 中 间 的 套 接 字 。 由 于 在 任 一 时 刻 ， 在 接收 主机 上 可 能 有 不 止 一 个 套 接 字 ， 所 以 每 
个 套 接 字 部 有 了 唯一 的 标识 符 。 标 识 符 的 格式 取决 于 它 是 UDP 还 是 TCP 套 接 字 ， 我 们 将 很 
快 对 它们 进行 讨论 。 
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图 3-2 运输 层 的 多 路 复 用 与 多 路 分 解 


现在 我 们 考虑 接收 主机 怎样 将 一 个 到 达 的 运输 层 报 文 段 定 向 到 适当 的 套 接 字 。 为 此 目 
的 ， 每 个 运输 层 报 文 段 中 具有 几 个 字段 。 在 接收 只 ， 运 输 层 检查 这 些 字 段 ， 标 识 出 接收 套 
接 字 ， 进 而 将 报 文 段 定 癌 到 该 套 接 字 。 将 运输 层 报 文 段 中 的 数据 交付 到 正确 的 套 接 字 的 工 
作 称 为 多 路 分 解 〈demultiplexing) 。 在 源 主 机 从 不 同 套 接 字 中 收集 数据 块 ， 并 为 每 个 数据 
块 封闭 上 育 部 信息 〈 这 将 在 以 后 用 于 分 解 ) 从 而 生成 报 文 段 ， 然 后 将 报 文 段 传递 到 网 络 
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所 有 这 些 工 作 称 为 多 路 复 用 (multiplexing) 。 但 得 注意 的 大 ， 图 3-2 中 的 中 间 那 台 主 


机 的 运 箱 层 必须 将 从 其 下 的 网 络 层 收 到 的 报 文 段 分 解 后 交 给 其 上 的 P, MP, 进程 这 一 过 
程 是 通过 将 到 达 的 报 文 段 数据 定 回 到 对 应 进程 的 父 接 字 来 完成 的 。 中国 主机 中 的 运输 层 也 
必须 收集 从 这 些 套 接 字 输出 的 数据 ， 形 成 运输 层 报 文 段 ， 然后 将 其 回 下 传递 给 网 络 层 . 尺 
管 我 们 在 因特网 运输 层 协 议 的 环境 下 引入 了 多 路 复 用 和 多 路 分 解 ， 认 识 到 下 列 事实 是 重要 
的 : 它们 与 在 某 层 (在 运输 层 或 别处 ) 的 单一 协议 何 时 被 位 于 接 下 来 的 较 高 层 的 多 个 协议 
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的 名 字 来 标识 . 当 Bill 从 邮递 员 处 收 到 一 批 信件 ， 并 通过 查看 收 信 人 和 名字 而 将 信件 亲手 交 


付 给 他 的 兄弟 姐妹 们 时 ， 他 执行 的 就 是 一 个 分 解 操作 。 当 Ann 从 兄弟 姐妹 们 那里 收 焦 信 件 
开 将 它们 交 给 邮递 员 时 ， 她 执行 的 就 是 一 个 多 路 复 用 操作 

既然 我 们 理解 了 运输 层 多 路 复 用 与 多 路 分 解 的 作用 ， 那 就 再 来 看 看 在 主机 中 它们 实际 
是 怎样 工作 的 、。 通 过 上 述 讨论 ,我们 知道 运输 层 多 路 复 用 要 求 : 山 套 接 字 有 唯一 标识 符 ; 


忆 每 个 报 文 段 有 特殊 字段 来 指示 该 报 文 段 所 要 交付 到 的 套 接 字 。 如 网 3-3 所 示 ， 这 些 特殊 
字段 是 源 端口 号 字段 (source port number field) 和 目的 端口 32 比 特 

号 字段 (destination ean number field), (UDP FRR TCP = 
RREA HAA HEB, HERE EAR AR IL ETT ong 目 药 端 口号 
讨论 。) 端口 号 是 一 个 16 比特 的 数 ， 其 大 小 在 0 ~ 65535 之 ps 
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number) ， 是 受 限 制 的 ， 这 是 指 它们 保留 给 诸如 HTTP ( 它 使 
用 端口 号 80) 和 FTP ( 它 使 用 端口 号 21) 之 类 的 周知 应 用 层 
协议 来 使 用 .周知 端口 的 列表 在 RFC 1700 中 给 出 ， 同 时 在 
http://www. iana. org 上 有 更 新 文档 | RFC 3232 | ， 当 我 们 开发 [43-3 运 辅 层 报 文 段 中 的 
一 个 新 的 应 用 程序 时 〈( 如 在 2.7 节 中 开发 的 一 个 应 用 程序 ) ， 源 与 目的 端口 字段 
必须 为 其 分 配 一 个 端口 号 。 

现在 应 该 清楚 运输 层 是 怎样 能 够 实现 分 解 服务 的 了 : 在 主机 上 的 每 个 套 接 字 能 够 分 配 
一 个 症 口 号 ， 当 报 文 段 到 达 主 机 时 ， 运 输 层 检查 报 文 段 中 的 目的 端口 号 ， 并 将 其 定 问 到 相 
应 的 套 接 字 。 然后 报 文 段 中 的 数据 通过 套 接 字 进 入 其 所 连接 的 进程 。 如 我 们 将 看 到 的 那 
样 ，UDP 基本 上 是 这 样 做 的 。 然 而 ， 也 将 如 我 们 所 见 ，TCP 中 的 多 路 复 用 与 多 路 分 解 更 为 
复杂 ， 

1. 无 连接 的 多 路 复 用 与 多 路 分 解 

2.7.1 节 讲 过 ， 在 主机 上 运行 的 Python 程序 使 用 下 面 一 行 代 码 创建 了 一 个 UDP 套 接 字 : 

clientSocket = socket(socket.AF INET, socket .SOCK DGRAM) 

当 用 这 种 方式 创建 一 个 UDP 套 接 字 时 ， 运 输 层 自动 地 为 该 套 接 字 分 配 一 个 端口 号 ， 
特别 是 ， 运 输 层 从 范围 1024 ~65535 内 分 配 一 个 端口 号 ， 该 端口 号 是 当前 未 被 该 主机 中 ff 
何其 他 UDP 端口 使 用 的 号 。 另 外 一 种 方法 是 ,在 创建 一 个 套 接 字 后 ， 我 们 能 够 在 Python 
程序 中 增加 一 行 代码 ， 通过 套 接 字 bind() 方法 为 这 个 UDP 套 接 字 关联 一 个 特定 的 端口 号 


(41 19157). 
clientSocket.bind((’‘, 19157)) 
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通过 为 UDP 套 接 字 分 配 端口 号 ， 我 们 现在 能 够 精确 地 描述 UDP 的 复 用 与 分 解 了 。 假 
定 在 主机 A 中 的 一 个 进程 具有 UDP 端口 19157， 它 要 发 送 一 个 应 用 程序 数据 块 给 位 于 主机 
B 中 的 另 一 进程 ， 该 进程 具有 UDP 端口 46428, EAL A 中 的 运输 层 创 建 一 个 运输 层 报 文 
没 ， 其 中 包括 应 用 程序 数据 、 源 端口 号 (19157)、 目 的 端口 与 (46428) 和 两 个 其 他 值 
(将 在 后 面 讨 论 ， 它 对 当前 的 讨论 并 不 重要 )。 然 后 ,运输 层 将 得 到 的 报 文 段 传 递 到 网 络 
层 ， 网 络 层 将 该 报 文 段 封 芍 到 一 个 IP 数据 报 中 ， 并 尽力 而 为 地 将 报 文 段 交付 给 接收 主机 。 
如 果 该 报 文 段 到 达 接 收 主机 B， 接 收 主机 运输 层 就 检查 该 报 文 段 中 的 目的 端口 号 (46428 ) 
并 将 该 报 文 段 交 付 给 端口 号 46428 所 标识 的 套 接 字 值得 注意 的 是 ， 主 机 B 能 够 运行 多 个 
进程 ， 每 个 进程 有 自己 的 UDP 套 接 字 及 相应 的 端口 号 。 值 得 注意 的 是 ， 主 机 B 可 能 运行 
多 个 进程 ， 每 个 进程 都 具有 其 日 己 的 UDP 套 接 字 和 相 联 系 的 端口 号 。 当 从 网 络 到 达 UDP 
报 文 段 时 ， 主 机 B 通过 检查 该 报 文 段 中 的 目的 端口 号 ， 将 每 个 报 文 段 定 问 (分解) 到 相 
应 的 套 接 字 。 

注意 到 下 述 事 实 是 重要 的 : 一 个 UDP 套 接 字 是 由 一 个 二 元 组 来 全 面 标识 的 ， 该 二 元 
组 包含 一 个 目的 IP 地址 和 一 个 目的 问 口 号 。 因 些 ， 如 果 两 个 UDP 报 文 段 有 不 同 的 源 卫 地 
址 和 /或 源 端口 号 ,但 有 具有 相同 的 目的 IP 地 址 和 目的 端口 号 ， 那么 这 两 个 报 文 段 将 通过 相 
同 的 日 的 套 接 字 被 定 问 到 相同 的 目的 进程 。 

你 也 许 现在 想 知道 ， 源 端口 号 的 用 途 是 什么 呢 ? 如 图 3-4 所 示 , 在 A 到 B 的 报 文 段 
中 ， 源 亲口 号 用 作 “ 返 回 地 址 ”的 一 部 分 ， 即 当 B 需要 回 发 一 个 报 文 段 给 A 时，B 到 A 
的 报 文 段 中 的 目的 端口 与 便 从 A 到 B 的 报 文 段 中 的 源 端 口号 中 取 值 。 (完整 的 返回 地 址 是 
A 的 IP 地 址 和 源 端 口号 ,) 举 一 个 例子 ， 回 想 2.7 节 学 习 过 的 那个 UDP 服务 器 程序 。 在 
UDPServer. py "P, IRA HEJH recvform () 方法 从 其 目 客 户 接收 到 的 报 文 段 中 提取 出 客户 端 
( 源 ) 端口 号 ， 然 后 ， 它 将 所 提取 的 源 端 口号 作为 目的 端口 号 ， 辐 客户 发 送 一 个 新 的 报 文 段 。 

一 客户 进程 

| EE 





Al3-4 源 疹 口号 与 目的 闪 口 号 的 反 转 
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2. 面 癌 连接 的 多 路 复 用 与 多 路 分 解 

为 了 理解 TCP 分解， 我 们 必须 更 为 仔细 地 研究 TCP 套 接 字 和 TCP 连接 创建 。TCP 套 
接 字 和 UDP 套 接 字 之 同 的 一 个 细微 差别 是 ，TCP 套 接 字 是 由 一 个 四 元 组 ( 源 IP 地 址 ， 源 
ngs, 目的 IP 地 址 ， 目 的 端口 号 ) 来 标识 的 。 这样 ， 当 一 个 TCP 报 文 段 从 网 络 到 达 一 
台 主 机 时 ， 该 主机 使 用 全 部 4 个 值 来 将 报 文 段 定向 (分解 ) 到 相应 的 套 接 字 。 特 别 与 UDP 
不 同 的 是 ， 两 个 具有 不 同 源 IP 地 址 或 源 端口 号 的 到 达 TCP 报 文 段 将 被 定 回 到 两 个 不 同 的 
套 接 字 ， 除 非 TCP 报 文 段 携带 了 初始 创建 连接 的 请 求 ， 为 了 深入 地 理解 这 一 点 ， 我 们 再 来 
重新 考虑 2.7. 2 节 中 的 TCP 客户 -服务 需 编 程 的 例子 : 

e TCP 服务 此 应 用 程序 有 一 个 “welcoming socket”， 它 在 12000 号 端口 上 等 待 来 日 

TCP 客户 〈 见 图 2-29) 的 连接 建立 请 求 
© TCP 客户 使 用 下 面 的 代码 创建 一 个 套 接 字 并 发 送 一 个 连接 建立 请 求 报 文 段 : 


clientSocket = socket(AF INET, SOCK _ STREAM ) 
ClientSocket .connect( (serverName,12000) ) 


。 一 条 连接 建立 请 求 只 不 过 是 一 个 目的 端口 号 为 12000，TCP 首部 的 特定 “连接 建立 
fy” 置 位 的 TCP 报 文 段 (在 3.5 节 进 行 讨论 )。 这 个 报 文 段 也 包含 一 个 由 客户 选 
择 的 源 端口 号 。 
。 当 运 行 服务 句 进 程 的 计算 机 的 主机 操作 系统 接收 到 具有 日 的 端口 12000 的 入 连接 
RRE. CWE MIRI itte, AFE E E m AO y 12000 等 行 接受 连接 ， 
ZIRI Ar E Fe WY BE — PY EES : 
connectionSocket, addr = serverSocket.accept() 
。 该 服务 需 的 运输 层 还 注意 到 连接 请 求 报 文 段 中 的 下 列 4 个 值 : (D 该 报 文 段 中 的 源 
端口 号 ; 思源 主机 IP 地 址 ; (3 该 报 文 段 中 的 目的 端口 号 ; OA SAY IP 地 址 。 新 创 
建 的 连接 套 接 字 通过 这 4 个 值 来 标识 。 所 有 后 续 到 达 的 报 文 段 ， 如 采 它 们 的 源 端 
口号 、 源 主机 IP 地 址 、 目 的 端口 号 和 目的 IP 地 址 都 与 这 4 个 值 匹配 ， 则 被 分 解 到 
这 个 套 接 字 。 随 着 TCP 连接 完成 ， 客 户 和 服务 右 便 可 相互 发 送 数 据 本 。 
服务 硕 主 机 可 以 支持 很 多 并 行 的 TCP 套 接 字 ， 每 个 套 接 字 与 一 个 进程 相 联系 ， 并 由 其 
四 元 组 来 标识 每 个 套 接 字 。 当 一 个 TCP 报 文 段 到 达 主 机 时 ， 所 有 4 个 字段 ( 源 IP 地 址 ， 
源 端口 ， 目 的 IP 地 址 ,目的 端口 ) 被 用 来 将 报 文 段 定向 〈 分 解 ) 到 相应 的 套 接 字 。 





端口 扫描 
我 们 已 经 看 到 一 个 服务 器 进程 潜在 地 在 一 个 打开 的 端口 等 待 远程 客户 的 接触 、 某 些 
端口 为 周知 应 用 程序 (例如 Web、FTP、DNS 和 SMTP 服务 器 ) PAB; 依照 惯例 其 他 


端口 由 流行 应 用 程序 (例如 微软 2000 SOL 服务 器 在 UDP 1434 端口 上 监听 请 求 ) 使 用 . 
因此 ， 如 果 我 们 确定 一 台 主 机 上 打开 了 一 个 端口 ， 也 许 就 能 够 将 该 端口 映射 到 在 该 主机 
运行 的 一 个 特定 的 应 用 程序 上 。 这 对 于 系统 管理 员 非 常 有 用 ， 系 统管 理 员 通常 希望 知晓 
有 什么 样 的 网 络 应 用 程序 正 运行 在 他 们 的 网 络 主机 上 ， 而 攻击 者 为 了 “寻找 突破 口 ”， 
也 要 知道 在 目标 主机 上 有 哪些 端口 打开 .如果 发 现 一 台 主 机 正在 运行 具有 已 知 安全 缺陷 
的 应 用 程序 (例如 ， 在 端口 1434 上 监听 的 一 台 SQL 服务 器 会 遭受 缓存 溢出 ， 使 得 一 个 
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FAP AEE DSCREN EPLET EAA, BW Fh Slammer 蜂 虫 所 利用 的 缺陷 
[ CERT 2003-04 |] ) ， 那 么 该 主机 已 成 为 攻击 者 的 过 中 之 物 了 ， 

确定 哪个 应 用 程序 正在 监听 哪些 端口 是 一 件 相对 容易 的 事情 。 事 实 上 有 许多 公共 域 
程序 ( 称 为 端口 扫描 器 ) 做 的 正 是 这 种 事情 。 也 许 它们 之 中 使 用 最 广泛 的 是 nmap， 该 
程序 在 http:Anmap. org/ 上 免费 可 用 ， 并 且 和 包括 在 大 多 数 Linux 分 发 软件 中 。 对 于 TCP, 
nmap 顺序 地 扫描 端口 ， 导 找 能 够 接受 TCP 连接 的 端口 。 对 于 UDP, nmap 也 是 顺序 地 打 
描 端 口 ， 寻 找 对 传输 的 UDP 报 文 段 进行 响应 的 UDP 端口 。 在 这 两 种 情况 下 ，nmap 返回 
打开 的 、 关 闭 的 或 不 可 达 的 端口 列表 。 运 行 nmap 的 主机 能 够 尝试 扫描 因特网 中 任何 地 
方 的 目的 主机 。 我 们 将 在 3.5.6 节 中 再 次 用 到 nmap， 在 该 节 中 我 们 将 讨论 TCP 连接 
管理 。 


图 3-5 图 示 了 这 种 情况 ， 图 中 主机 C in ike B 发 起 了 两 个 HTTP 会 话 ， 主 机 A 回 服 
务 器 B 发 起 了 一 个 HTTP 会 话 。 主 机 A 与 主机 C 及 服务 器 BABA A CHE—AY IP Hoot, € 
们 分 别 是 A、C、B。 主 机 C 为 其 两 个 HTTP 连接 分 配 了 两 个 不 同 的 源 端 口号 (26145 和 
7532 ) 。 因 为 主机 A 选择 源 端 口号 时 与 主机 C 互 不 相干 ， 因 此 它 也 可 以 将 源 病 口号 26145 
分 配给 其 HTTP 连接 。 但 这 不 是 问题 ， 即 服务 侣 B 仍然 能 够 正确 地 分 解 这 两 个 具有 相同 源 
端口 号 的 连接 ， 因 为 这 两 条 连接 有 不 同 的 源 IP 地 址 。 


Web 客 户 F 每 个 连接 
主机 C Web 服 务 器 B HTTP 进程 











图 3-5 两 个 客户 使 用 相同 的 目的 端口 号 (80) 与 同一 个 Web 服务 顺应 用 通信 


3. Web 服务 占 与 TCP 
在 结束 这 个 讨论 之 前 ， 再 多 说 几 句 Web 服务 副 以 及 它们 如 何 使 用 端口 号 是 有 益 的 。 
考虑 一 台 运 行 Web 服务 例 的 主机 ， 例 如 在 端口 80 上 运行 一 个 Apache Web IRA, SRP 





(UAE (AHR SS AF ACK AR CRY, PAAR OC BAY A Aim AISI A 80. 特别 是 ， 初 始 
连接 建立 报 文 段 和 承载 HTTP 请 求 的 报 文 段 都 有 80 的 目的 端口 。 如 我 们 刚才 描述 的 那样 ， 
该 服务 器 能 够 根据 源 IP 地 址 和 源 端口 号 来 区 分 来 自 不 同 客 户 的 报 文 段 。 

图 3-5 显示 了 一 台 Web 服务 天 为 每 条 连接 生成 一 个 新 进程 .如 网 3-5 所 示 ， 每 个 这 样 
的 进程 都 有 目 己 的 连接 套 接 字 ， 通 过 这 些 套 接 字 可 以 收 到 AT TP 请 求 和 发 送 HTTP Oy fiz. 
然而 、 我 们 要 提 及 的 是 ， 连 接 套 接 字 与 进程 之 间 并 非 总 是 有 着 一 一 对 应 的 关系 。 事 实 上 ， 
当今 的 高 性 能 Web 服务 器 通常 只 使 用 一 个 进程 ， 但 是 为 每 个 新 的 客户 连接 创建 一 个 具有 
新 连接 套 接 字 的 新 线程 。( 线 程 可 被 看 作 是 一 个 轻 量 级 的 子 进程 5) 如 果 做 了 第 2 草 的 第 一 
个 编程 作业 ， 你 所 构建 的 Web 服务 器 就 是 这 样 工 作 的 。 对 于 这 样 一 人 台 服 务 硕 ， 在 任意 给 
定 的 时 间 内 都 可 能 有 (有 具有 不 同 标识 的 ) 许多 连接 套 接 字 连接 到 相同 的 进程 。 

如 果 客 户 与 服务 器 使 用 持续 HTTP， 则 在 整 条 连接 持续 期 间 ， 客 户 与 服务 融 之 间 经 由 


每 一 对 请 求 / 啊 应 都 创建 一 个 新 的 TCP 连接 并 在 随后 关闭 ， 因 此 对 每 一 对 请 求 / 啊 应 创建 一 
个 新 的 套 接 字 并 在 随后 关闭 。 这 种 套 接 字 的 频繁 创建 和 关闭 会 严重 地 影响 一 个 繁忙 的 Web 
服务 帮 的 性 能 (尽管 有 许多 操作 系统 技巧 可 用 来 减轻 这 个 问题 的 影响 )， 读者 大 对 与 持续 
和 非 持 续 HTTP 有 关 的 操作 系统 问题 感 兴趣 的 话 ， 可 人 参见 | Nielsen 1997, Nahum 2002 } - 

既然 我 们 已 经 讨论 过 了 运输 层 多 路 复 用 与 多 路 分 解 问 题 ， 下 面 我 们 就 继续 讨论 因特网 
运输 层 协议 之 一 ， 即 UDP。 在 下 一 市 中 ,我 们 将 看 到 UDP 无 非 就 是 对 网 络 层 协议 增加 了 
一 点 〈 多 路 ) 复 用 /( 多 路 ) 分 解 服务 而 已 ， 


3.3 无 连接 运输 : UDP 


在 本 节 中 ， 我 们 要 仔细 地 研究 一 下 UDP， 看 它 是 怎样 工作 的 ， 能 做 些 什 么 。 我 们 或 励 
你 回 过 来 看 一 下 2.1 市 的 内 容 ， 其 中 包括 了 UDP 服务 模型 的 概述 ， 再 看 看 2.7. 1 节 ， 其 中 
讨论 了 UDP 上 的 套 接 字 编程 。 

为 了 激发 我 们 讨论 UDP 的 热情 ， 假 如 你 对 设计 一 个 不 提供 不 必要 服务 的 最 简化 的 运 
蓟 层 协 以 感 兴趣 。 你 将 打算 怎样 做 呢 ?” 你 也 许 会 首先 考虑 使 用 一 个 无 所 事 事 的 运输 层 协 
议 。 特 别 古 在 发 送 方 一 侧 ， 你 可 能 会 考虑 将 来 目 应 用 进程 的 数据 直接 交 给 网 络 层 ; 在 接收 
方 一 侧 ， 你 可 能 会 考虑 将 从 网 络 层 到 达 的 报 文 直接 交 给 应 用 进程 。 而 正如 我 们 在 前 一 节 所 


解 服务 ， 以 便 在 网 络 层 与 正确 的 应 用 级 进程 之 间 传 递 数据 。 

由 | RFC 768] 定义 的 UDP 只 是 做 了 运输 协议 能 够 做 的 最 少 工作 。 除 了 复 用 /分 解 功 
能 及 少量 的 差错 检测 外 ， 它 几乎 没有 对 IP 增加 别 的 东西 。 实 际 上 ， 如 有 果 应 用 程序 开发 人 
员 选 择 UDP 而 不 是 TCP， 则 该 应 用 程序 差不多 就 是 直接 与 IP 打交道 。UDP 从 应 用 进程 得 
到 数据 ， 附 加 上 用 于 多 路 复 用 /分 解 服务 的 源 和 目的 端口 号 字段 ， 以 及 两 个 其 他 的 小 字段 ， 
然后 将 形成 的 报 文 段 交 给 网 络 层 。 网 络 层 将 该 运输 层 报 文 段 封 装 到 一 个 IP 数据 报 中 ， 然 
后 尽力 而 为 地 尝试 将 此 报 文 段 交付 给 接收 主机 。 如 果 该 报 文 段 到 达 接 收 主机 ，UDP 使 用 目 
的 端口 号 将 报 文 段 中 的 数据 交付 给 正确 的 应 用 进程 。 值 得 注意 的 是 ， 使 用 UDP 时 ， 在 发 
送 报 文 段 之 前 ， 发 送 方 和 接收 方 的 运输 层 实 体 之 间 没 有 握手 。 正 因为 如 此 ，UDP 被 称 为 是 
无 连接 的 。 

DNS 是 一 个 通常 使 用 UDP 的 应 用 层 协议 的 例子 。 当 一 台 主 机 中 的 DNS 应 用 程序 想 要 
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进行 一 次 查询 时 ， 它 构造 了 一 个 DNS 查询 报 文 并 将 其 交 给 UDP。 无 须 执行 任何 与 运行 在 
日 的 端 系统 中 的 UDP 实体 之 间 的 握手 ， 主 机 端的 UDP 为 此 报 文 添加 首部 字段 ， 然 后 将 形 
成 的 报 文 段 交 给 网 络 层 .网 络 层 将 此 UDP 报 文 段 封装 进 一 个 IP 数据 报 中 ， 然 后 将 其 发 送 
给 一 个 名 字 服 务 磊 。 在 查询 主机 中 的 DNS 应 用 程序 则 等 待 对 该 查询 的 啊 应 。 如 果 它 没有 
收 到 啊 应 (可 能 是 由 于 展 层 网 络 丢 失 了 查询 或 啊 应 ) ， 则 要 么 试 网 癌 男 一 个 名 字 服 务 化 发 
送 该 查询 ， 要 么 通知 调用 的 应 用 程序 它 不 能 获得 响应 。 
现在 你 也 许 想 知道 ， 为 什么 应 用 开发 人 员 宁 愿 在 UDP 之 上 构建 应 用 ， 而 不 选择 在 TCP 
上 构建 应 用 ?既然 TCP 提供 了 可 靠 数 据 传 输 服 务 ， 而 UDP 不 能 提供 ， 那 么 TCP 是 否 总 是 
首选 的 呢 ? 答案 是 否定 的 ， 因 为 有 许多 应 用 更 适合 用 UDP， 原 因 主 要 以 下 几 点 : 
e 关于 何 时 、 发 送 什么 数据 的 应 用 层 控制 更 为 精细 ， 采 用 UDP 时 ， 只 要 应 用 进程 将 
数据 传递 给 UDP, UDP 就 会 将 此 数据 打包 进 UDP 报 文 段 并 立即 将 其 传递 给 网 络 
lz. 在 另 一 方面 ，TCP 有 一 个 拥 窒 控制 机 制 ， 以 便当 源 和 目的 主机 间 的 一 条 或 多 
条 链 路 变 得 极度 拥塞 时 来 遏制 运输 层 TCP 发 送 方 。TCP 仍 将 继续 重新 发 送 数 据 报 
文 段 直到 目的 主机 收 到 此 报 文 并 加 以 确认 ， 而 不 管 可 菲 交 付 需 要 用 多 长 时 间 ， 上 内 
为 实时 应 用 通常 要 求 最 小 的 发 送 速率 ， 不 和 布 望 过 分 地 延迟 报 文 段 的 传送 ， 且 能 容 
和 包 一 些 效 据 丢失 ，TCP 服务 模型 并 不 是 特别 适合 这 些 应 用 的 震 要 如 后 面 所 讨论 
的 ， 这 些 应 用 可 以 使 用 UDP， 并 作为 应 用 的 一 部 分 来 实现 所 需 的 、 超 出 UDP 的 不 
提供 不 必要 的 报 文 段 交 付 服务 之 外 的 额外 功能 。 
e 无 需 连 接 建 立 ， 如 我 们 后 面 所 讨论 的 ，TCP 在 开始 数据 传输 之 前 要 经 过 三 次 握手 . 
UDP 却 不 需要 任何 准备 即 可 进行 数据 传输 。 因 此 UDP 不 会 引入 建立 连接 的 时 延 , 
这 可 能 是 DNS 运行 在 UDP 之 上 而 不 是 运行 在 TCP 之 上 的 主要 原因 (如 果 运 行 在 
TCP E, W) DNS 会 慢 得 多 ) HTTP 使 用 TCP 而 不 是 UDP， 因 为 对 于 具有 文本 数据 
的 Web 网 页 来 说 ， 可 靠 性 是 至 关 重 要 的 。 但 是 ， 如 我 们 在 2. 2 4H a Bee AY HB 
FE, HTTP 中 的 TCP 连接 建立 时 延 对 于 与 下 载 Web 文档 相关 的 时 延 来 说 是 一 个 重 


要 因素 . 
。 无 连接 状态 。TCP 需要 在 端 系统 中 维护 连接 状态 。 此 连接 状态 包括 接收 和 发 送 组 
存 、 拥 塞 控制 参数 以 及 序号 与 确认 号 的 参数 。 我 们 将 在 3.5 节 看 到 ， 要 实现 TCP 


的 可 靠 数据 传输 服务 并 提供 拥塞 控制 ， 这 些 状态 信息 是 必要 的 。 在 另 一 方面 ， 
UDP 不 维护 连接 状态 ， 也 不 跟踪 这 些 参数 。 因 此 ， 某 些 专门 用 于 某 种 特定 应 用 的 
服务 器 当 应 用 程序 运行 在 UDP 之 上 而 不 是 运行 在 TCP 上 时 ， 一 般 都 能 支持 更 多 的 
活跃 客户 。 

。 分 组 首部 开销 小 。 每 个 TCP 报 文 段 都 有 20 字 节 的 首部 开销 ， 而 UDP 仅 有 8 FH 

的 开销 . 

图 3-6 列 出 了 流行 的 因特网 应 用 及 其 所 使 用 的 运输 协议 。 如 我 们 所 期 望 的 那样 ， 电 子 
邮件 、 远 程 终端 访问 、Web 及 文件 传输 都 运行 在 TCP 之 上 。 因 为 所 有 这 些 应 用 都 需要 TCP 
的 可 靠 数据 传输 服务 。 无 论 如 何 ， 有 很 多 重要 的 应 用 是 运行 在 UDP 上 而 不 是 TCP 上 
UDP 被 用 于 RIP 路 由 选择 表 的 更 新 〈 参 见 4. 6. 1 节 ) 。 因 为 这 些 更 新 被 周期 性 地 发 送 ( 通 
常 每 5 分 钟 一 次 ) ， 更 新 的 丢失 能 被 最 近 的 更 新 所 赫 代 ， 因 此 丢 包 、 过 期 的 更 新 是 无 用 的 
UDP 也 用 于 承载 网 络 管理 数据 (SNMP， 参 见 第 9 草 )。 在 这 种 场合 下 ，UDP 要 优 于 TOP, 
因为 网 络 管理 应 用 程序 通常 必须 在 该 网 络 处 于 重 压 状态 时 运行 ， 而 正 是 在 这 个 时 候 可 千 
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的 、 拥 塞 受 控 的 数据 传输 难以 实现 。 此 外 ， 如 我 们 前 面 所 述 ，DNS 运行 在 UDP ŽE, M 
而 避免 了 TCP 的 连接 创建 时 延 。 


应 用 应 用 层 协议 下 面 的 运输 协议 


远程 终端 访问 












文件 传输 


远程 文件 服务 加 






流 式 多 媒体 














因特网 电话 通常 专用 UDP 或 TCP 
路 由 选择 协议 通常 UDP 
名 字 转 换 DNS 通常 UDP 


图 3-6 流行 的 因特网 应 用 及 其 下 面 的 运输 协议 


如 图 3-6 所 示 ，UDP 和 TCP 现在 都 用 于 多 媒体 应 用 ， 如 因特网 电话 、 实 时 视频 会 以 、 
流 式 存储 音频 与 视频 。 我 们 将 在 第 7 章 仔 细 学 习 这 些 应 用 。 我 们 刚 说 过 ， 了 既然 所 有 这 些 应 
用 都 能 容忍 少量 的 分 组 丢失 ， 央 此 可 靠 数据 传输 对 于 这 些 应 用 的 成 功 并 不 是 至 关 重 要 的 .。 
此 外 ，TCP 的 拥塞 控制 会 导致 如 因特网 电话 、 视 频 会 议 之 类 的 实时 应 用 性 能 变 得 很 差 。 由 
于 这 些 原因 ， 多 媒体 应 用 开发 人 员 通 常 将 这 些 应 用 运行 在 UDP 之 上 而 不 是 TCP 之 上 。 然 
而 ，TCP 被 越 来 越 多 地 应 用 于 流 式 多 媒体 传输 中 。 例 如 ，L Sripanidkulchai 2004] 发 现 大 约 
75% 的 按 需 和 实况 流 式 多 媒体 使 用 了 TCP。 当 分 组 丢 包 率 低 时 ， 并 且 为 了 安全 原因 ， 茶 些 
机 构 阻 塞 UDP 流量 (参见 第 8 章 ) ， 对 于 流 式 媒体 传输 来 说 ，TCP 变 得 越 来 越 有 吸引 
Ts 

虽然 目前 通常 这 样 做 ,但 在 UDP 之 上 运行 多 媒体 应 用 是 有 争议 的 。 如 我 们 前 面 所 
述 ，UDP 没有 拥塞 控制 。 但 是 ,需要 拥塞 控制 来 预防 网 络 进入 一 种 拥塞 状 态 ， 此 时 只 目 
做 很 少 的 有 用 工作 。 如 果 每 个 人 都 启动 流 式 高 比特 率 视频 而 不 使 用 任何 拥塞 控 制 的 话 ， 
就 会 使 路 由 器 中 有 大 量 的 分 组 洪 出 ， 以 至 于 几乎 没有 UDP 分 组 能 成 功 地 通过 源 到 目的 
的 路 径 传输 。 况 且 ， 由 无 控制 的 UDP 发 送 方 引入 的 高 丢 包 率 将 引起 TCP 发 送 方 ( 如 我 
们 将 看 到 的 那样 ，TCP 遇 到 拥塞 将 减 小 它们 的 发 送 速率 ) 大 大 地 减 小 它们 的 速率 。 因 
IE, UDP 中 缺乏 拥塞 控制 能 够 导致 UDP 发 送 方 和 接收 方 之 间 的 高 丢 包 率 ， 并 挤 垮 TCP 
会 话 ， 这 是 一 个 潜在 的 严重 问题 [Floyd 1999 ] 。 很 多 研究 人 员 已 提出 了 一 些 新 机 制 ， 以 促 
使 所 有 的 数据 源 (包括 UDP W) 执行 自 适应 的 拥塞 控制 [| Mahdavi 1997; Floyd 2000; 
Kohler 2006; RFC 4340]. 

在 讨论 UDP 报 文 段 结 构 之 前 ， 我 们 要 提 一 下 ， 使 用 UDP 的 应 用 是 可 以 实现 可 徘 数据 
传输 的 。 这 可 通过 在 应 用 程序 自身 中 建立 可 靠 性 机 制 来 完成 (例如 ， 可 通过 增加 确认 与 重 
传 机 制 来 实现 ， 如 采用 我 们 将 在 下 一 节 学 习 的 一 些 机 制 ) 。 但 这 并 不 是 无 足 轻 重 的 任务 ， 
它 会 使 应 用 开发 人 员 长 时 间 地 忙于 调试 。 无 论 如 何 ， 将 可 靠 性 直接 构建 于 应 用 程序 中 可 以 
使 其 “左右 着 源 ”。 也 就 是 说 应 用 进程 可 以 进行 可 靠 通信 ， 而 无 第 受制 于 由 TCP 拥塞 控制 
机 制 而 无 需 受 制 于 传输 速率 限制 。 
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3.3.1 UDP 报 文 段 结构 


UDP 报 文 段 结构 如 图 3-7 所 示 ， 它 由 REC 768 定义 。 应 用 层 数 据 占 用 UDP 报 文 段 的 
数据 字段 。 例 如 ， 对 于 DNS 应 用 ， 数 据 字段 要 么 包含 一 个 查询 报 文 ， 要 么 包含 一 个 响应 
报 文 。 对 于 流 式 音频 应 用 ， 音 频 抽样 数据 填充 到 数据 字段 。UDP 首部 只 有 4 个 字段 ， 每 个 
字段 由 两 个 字 节 组 成 。 如 前 一 节 所 讨论 的 ， 通 过 端口 号 可 以 使 目的 主机 将 应 用 数据 交 给 运 
行 在 目的 端 系统 中 的 相应 进程 即 执行 分 解 功能 ) 。 长 度 字 32 比 特 
段 指示 了 在 UDP 报 文 段 中 的 字 节 数 (首部 加 数据 ) 。 因 为 数 “ 一 一 一 一 一 一 - 
据 字段 的 长 度 在 一 个 UDP 段 中 不 同 于 在 另 一 个 段 中 ， 故 需要 。 ak 
一 个 明确 的 长 度 。 接 收 方 使 用 检验 和 来 检查 在 该 报 文 段 中 是 
否 出 现 了 差错 。 实 际 上 ， 计 算 检验 和 时 ， 除 了 UDP 报 文 段 以 
外 还 包括 了 IP 首部 的 一 些 字段 。 但 是 我 们 忽略 这 些 细节 ， 以 
便 能 从 整体 上 看 问题 。 下 面 我 们 将 讨论 检验 和 的 计算 。 在 
5. 2 节 中 将 描述 差错 检测 的 基本 原理 。 长 度 字段 指 明了 包括 
首部 在 内 的 UDP 报 文 段 长 度 ( 以 字 节 为 单位 )。 ot Te 








3.3.2 UDP 检验 和 


UDP 检验 和 提供 了 差错 检测 功能 。 这 就 是 说 ,检验 和 用 于 确定 当 UDP 报 文 段 从 源 到 
达 目 的 地 移动 时 ， 其 中 的 比特 是 否 发 生 了 改变 (例如 ， 由 于 链 路 中 的 噪声 干扰 或 者 存储 在 
路 由 器 中 时 引入 问题 ) 。 发 送 方 的 UDP 对 报 文 段 中 的 所 有 16 比特 字 的 和 进行 反 码 运算 ， 
求 和 时 过 到 的 任何 溢出 都 被 回 卷 。 得 到 的 结果 被 放 在 UDP 报 文 段 中 的 检验 和 字段 。 下 面 
给 出 一 个 计算 检验 和 的 简单 例子 。 在 RFC 1071 中 可 以 找到 有 效 实现 的 细 市 ， 还 可 在 
[Stone 1998; Stone 2000] 中 找到 它 处 理 真 实数 据 的 性 能 。 举 例 来 说 ， 假 定 我 们 有 下 面 3 
个 16 比特 的 字 : 
0110011001100000 
0101010101010101 
1000111100001100 
这 些 16 比特 字 的 前 两 个 之 和 是 : 
0110011001100000 
0101010101010101 
1011101110110101 
再 将 上 面 的 和 与 第 三 个 字 相 加 ， 得 出 : 
1011101110110101 
1000111100001 100 
010010101 1000010 
ER Ea OME A att, CRR., KEZA MEKA OO 换 成 1， 所 有 的 
1 转换 成 0。 因 此 ,该 和 0100101011000010 的 反 码 运算 结果 是 1011010100111101， 这 变 为 
了 检验 和 。 在 接收 方 ， 全 部 的 4 个 16 比特 字 (包括 检验 和 ) 加 在 一 起 。 如 果 该 分 组 中 没 
有 引入 差错 ， 则 显然 在 接收 方 处 该 和 将 是 1111111111111111。 如 果 这 些 比特 之 一 是 0， 那 
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你 可 能 想 知道 为 什么 UDP 首先 提供 了 检验 和 ， 就 像 许 多 链 路 层 协 议 (包括 流行 的 
以 太 网 协议 ) 也 提供 了 差错 检测 那样 ， 其 原因 是 由 于 不 能 保证 源 和 目的 之 间 的 所 有 链 路 
部 提供 差错 检测 ; 这 就 是 说 ， 也 许 这 些 链 路 中 的 一 条 可 能 使 用 没有 差错 检测 的 协 以 。 此 
外 ， 即 使 报 文 段 经 链 路 正确 地 传输 ， 当 报 文 段 存 储 在 某 台 路 由 上 需 的 内 存 中 时 ， 也 可 能 引 
入 比特 差错 .在 既 无 法 确保 逐 链 路 的 可 靠 性 ， 又 无 法 确保 内 存 中 的 差错 检测 的 情况 下 ， 
如 果 端 到 端 数据 传输 服务 要 提供 差错 检测 ，UDP 就 必须 在 端 到 端 基础 上 在 运输 层 提供 差 
错 检 测 ， 这 是 一 个 在 系统 设计 中 被 称 贷 的 端 到 端 原则 (end-end principle) 的 例子 
[ Saltzer 1984] ， 该 原则 表述 为 因为 某 种 功能 (在 此 时 为 差错 检测 ) Bt SE tg Stig “SC 
现 :“ 与 在 较 高 级 别提 供 这 些 功能 的 代价 相 比 ， 在 较 低 级 别 上 设置 的 功能 可 能 是 元 余 的 
或 几乎 没有 价值 的 。” 

因为 假定 IP 是 可 以 运行 在 任何 第 二 层 协 议 之 上 的 ,运输 层 提供 差错 检测 作为 一 种 保 
险 措施 是 非常 有 用 的 。 虽 然 UDP 提供 差错 检测 ， 但 它 对 差错 恢复 无 能 为 力 ，UDP 的 某 种 
实现 只 是 丢弃 受 损 的 报 文 段 ， 其 他 实现 是 将 受 损 的 报 文 段 交 给 应 用 程序 并 给 出 警告 . 

至 此 结束 了 关于 UDP 的 讨论 。 我 们 将 很 快 看 到 TCP 为 应 用 提供 了 了 可靠 数据 传输 太 
UDP 所 不 能 提供 的 其 他 服务 -TCP 自然 要 比 UDP 复杂 得 多 . 然而 ， 在 过 论 TCP 之 前 ， 我 
们 后 退 一 步 ， 先 来 讨论 一 下 可 徘 数 据 传输 的 基本 原理 是 有 用 的 ， 


3.4 可 靠 数 据 传输 原理 


在 本 节 中 ， 我 们 在 通常 情况 下 考虑 可 徘 数 据 传输 的 问题 ， 因为 可 逢 数据 传输 的 实现 问 
题 不 仅 在 运输 层 出 现 ， 也 会 在 链 路 层 以 及 应 用 层 出 现 ， 这 时 讨论 它 是 恰当 的 。 Kik, A 
性 问题 对 网 络 来 说 更 为 重要 。 如 果 的 确 要 将 所 有 网 络 中 最 为 重要 的 “前 10 个 ”问题 排名 
的 话 ， 可 靠 数 据 传输 将 是 名 列 榜首 的 候选 者 。 在 下 一 节 中 ， 我 们 将 学 习 TCP， 尤其 要 说 明 
TCP 所 采用 的 许多 原理 ， 而 这 些 正 是 我 们 打算 描述 的 内 容 。 

el 3-8 图 示 说 明了 我 们 学 习 可 靠 数据 传输 的 框架 。 为 上 层 实体 提供 的 服务 抽象 是 : 数 
据 可 以 通过 一 条 可 靠 的 信道 进行 传输 。 借 助 于 可 徘 信 道 ， 传 输 数 据 比特 就 不 会 受到 损坏 
(由 0 变 为 1， 或 者 相反 ) 或 丢失 ， 而 且 所 有 数据 都 是 按照 其 发 送 顺 友 进行 交付 。 这 恰好 
就 是 TCP 向 调用 它 的 因特网 应 用 所 提供 的 服务 模型 。 

实现 这 种 服务 抽象 是 可 靠 数 据 传输 协议 (reliable data transfer protocol) 的 责任 .由 于 
可 笔 数 据 传输 协议 的 下 层 协 议 也 许 是 不 可 靠 的 ， 因 此 这 是 一 项 困难 的 任务 . 例如，TCP oe: 
在 不 可 靠 的 (IP) 端 到 端 网 络 层 之 上 实现 的 可 靠 数据 传输 协议 。 更 一 般 的 情 次 是 ， 两 个 可 
靠 通 信 端 点 的 下 层 可 能 是 由 一 条 物理 链 路 〈 如 在 链 路 级 数据 传输 协议 的 场合 下 ) 组 成 或 是 
由 一 个 全 球 互联 网 络 (如 在 运输 级 协议 的 场合 下 ) 组 成 。 然 而 ， 就 我 们 的 目的 而 言 ， 我 们 
可 将 较 低 层 直接 视 为 不 可 靠 的 点 对 点 信道 。 

在 本 节 中 ,考虑 到 底层 信道 模型 越 来 越 复杂 ， 我 们 将 不 断 地 开发 一 个 可 徘 数据 传输 协 
议 的 发 送 方 和 接收 方 。 例 如 ， 我 们 将 考虑 当 底 层 信 道 能 够 损坏 比特 或 丢失 整个 分 组 时 ， 午 
要 什么 样 的 协议 机 制 。 这 里 贯穿 我 们 讨论 始终 的 一 个 假设 是 分 组 将 以 它们 发 送 的 次 序 进行 
交付 ， 某 些 分 组 可 能 会 丢失 ; 这 就 是 说 ， 底 层 信道 将 不 会 对 分 组 重 排序 ， 网 3-8b 图 示 说 
明了 用 于 数据 传输 协议 的 接口 。 通 过 调用 rdt_send () 图 数 ， 可 以 调用 数据 传输 协议 的 发 送 








方 。 它 将 要 发 送 的 数据 交付 给 位 于 接收 方 的 较 高 层 . ( 这 里 rdt 表示 可 靠 数 据 传输 协议 ， 
_send 指示 rdt 的 发 送 端正 在 被 调用 。 开发 任何 协议 的 第 一 步 就 是 要 选择 一 个 好 的 名 字 1) 
在 接收 端 ， 当 分 组 从 信道 的 接收 端 到 达 时 ， 将 调用 rdt_rev() 。 当 rdt 协议 想 要 向 较 高 层 交 
付 数据 时 ， 将 通过 调用 deliver_data() 来 完成 。 后 面 ， 我 们 将 使 用 术语 “分 组 ”而 不 用 运输 
层 的 “ 报 文 段 "。 因 为 本 节 研 讨 的 理论 适用 于 一 般 的 计算 机 网 络 ， 而 不 只 是 用 于 因特网 运 
答 层 ， 所 以 这 时 采用 通用 术语 “分 组 ”也 许 更 为 合适 
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图 3-8 可 靠 数 据 传输 : 服务 模型 与 服务 实现 


在 本 节 中 ， 我 们 仅 考 虑 单 向 数据 传输 (unidirectional data transfer) 的 情况 ， 即 数据 传 
输 是 从 发 送 端 到 接收 疹 的 。 可 靠 的 双向 数据 传输 (bidirectional data transfer) ( 即 全 双 工 数 
据 传 输 ) 情况 从 概念 上 讲 不 会 更 难 ， 但 解释 起 来 更 为 单调 乏味 。 虽 然 我 们 只 考虑 单 问 数据 
传输 ， 注 意 到 下 列 事实 是 重要 的 ， 我 们 的 协议 也 青 要 在 发 送 闪 和 接收 闪 两 个 方向 上 传输 分 
组 ， 如 图 3-8 所 示 。 我 们 很 快 会 看 到 ， 除 了 交换 含有 竺 传送 的 数据 的 分 组 之 外 ，rdt 的 发 送 
问 和 接收 端 还 秆 往返 交换 控制 分 组 。rdt 的 发 送 痪 和 接收 疹 都 要 通过 调用 udt_send() 发 送 分 
组 给 对 方 (其 中 udt 表示 不 可 靠 数 据 传输 )。 
3.4.1 构造 可 靠 数 据 传输 协议 

我 们 现在 一 步 步 地 研究 一 系列 协 以 ， 它 们 一 个 比 一 个 更 为 复杂 ， 最 后 得 到 一 个 无 错 、 
可 徘 的 数据 传输 协 以 -。 

1. 经 完全 可 靠 信道 的 可 靠 数 据 传输 : rdt 1. 0 

首先 ， 我 们 考虑 最 简单 的 情况 ， 即 底层 信道 是 完全 可 徘 的 。 我 们 称 该 协议 为 dtl. 0, 
该 协议 本 身 是 简单 的 。 图 3-9 显示 了 rdt 1.0 发 送 方 和 接收 方 的 有 限 状 态 机 (Finite- State 
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Machine, FSM) 的 定义 。 图 3-9a 中 的 FSM 定义 了 发 送 方 的 操作 ， 图 3-9b 中 的 PSM 定义 
了 接收 方 的 操作 。 注意 到 下 列 问 题 是 重要 的 ， 发 送 方 和 接收 方 有 各 自 的 FSM-. 图 3-9 中 发 
送 方 和 接收 方 的 FSM 每 个 都 只 有 一 个 状态 。FSM a A Se Me ia 
变迁 到 为 一 个 状态 。( 因为 图 3-9 中 的 每 个 FSM 都 只 有 一 个 状态 ， 因 此 变迁 必定 = 
状态 返回 到 目 喘 ; 我 们 很 快 将 看 到 更 复杂 的 状态 图 .) 引起 变迁 的 事件 显示 在 表示 亚 FIERY 
横 线 上 方 ， 事 件 发 生 时 所 采取 的 动作 显示 在 、、 
模 线 下 方 。 如 果 对 一 个 事件 没有 动作 ,或 没 a 
有 就 事件 发 生 而 采取 了 一 个 动作 ， 我们 将 在 + 
横 线 上 方 或 下 方 使 用 符号 A， 以 分 别 明确 地 
表示 缺少 动作 或 事件 。FSM 的 初始 状态 用 虚 
线 表示 。 尽 管 图 3-9 PAY FSM 只 有 一 个 状态 ， ag 0 发生 加 
但 马上 我 们 就 将 看 到 多 状态 的 FSM, [Al pp 
识 每 个 FSM 的 初始 状态 是 非常 重要 的 。 

rdt 的 发 送 端 只 通过 rdt_send ( data ) 事件 
接受 来 目 较 高 层 的 数据 ,产生 一 个 包含 该 数 
据 的 分 组 (经 由 make_pkt( data) 动 作 ) ， 并 将 
分 组 发 送 到 信道 中 。 实 际 上 ，rdt_send( data) b) rdt1.0: 接收 端 
事件 是 由 较 遍 层 应 用 的 过 程 调 用 产生 的 例 
Un, rdt_send() ) 。 

在 接收 端 ，rdt 通过 rdt_rev( packet) 事件 从 底层 信道 接收 一 个 分 组 ， 从 分 组 中 取出 数据 
(经 由 extract( packet, data) 动作 ) ， 并 将 数据 上 传 给 较 高 层 (通过 deliver_data( data) 动作 ) 。 
实际 上 ，rdt_rev( packet) 事件 是 由 较 低 层 协议 的 过 程 调 用 产生 的 〈 例 如 ，rdt_rev() ) 。 

在 这 个 简单 的 协议 中 ， 一 个 单元 数据 与 一 个 分 组 没 差别 。 而 且 ， 所 有 分 组 是 从 发 送 方 
流向 接收 方 ;， 有 了 完全 可 靠 的 信道 ， 接 收 端 就 不 需要 提供 任何 反馈 信息 给 发 送 方 ， 因 为 不 
必 担 心 出 现 差错 ! 注意 到 我 们 也 已 经 假定 了 接收 方 接收 数据 的 速率 能 够 与 发 送 方 发 送 数据 
的 速率 一 样 快 。 因 此 ， 接 收 方 没有 必要 请 求 发 送 方 慢 一 点 ! 

2. 经 具有 比特 差错 信道 的 可 靠 数 据 传输 : rdt 2. 0 

底层 信道 更 为 实际 的 模型 是 分 组 中 的 比特 可 能 受 损 。 在 分 组 的 传输 、 传 播 或 缓存 的 过 
程 中 ， 这 种 比特 差错 通常 会 出 现在 网 络 的 物理 部 件 中 。 我 们 眼下 还 将 继续 假定 所 有 发 送 的 
分 组 (虽然 有 些 比 特 可 能 受 损 ) 将 按 其 发 送 的 顺序 被 接收 。 

在 研发 一 种 经 这 种 信道 进行 可 靠 通信 的 协议 之 前 ， 首 先 考 虑 一 下 人 们 会 怎样 处 理 这 类 
情形 。 考 虑 一 下 你 目 己 是 怎样 通过 电话 口述 一 条 长 消息 的 。 在 通常 情况 下 ， 报 文 接收 者 在 
听 到 、 理 解 并 记 下 每 句 话 后 可 能 会 说 “OK”。 如 果 报 文 接 收 者 听 到 一 句 含 糊 不 清 的 话 时 ， 
他 可 能 要 求 你 重复 刚才 那 句 话 。 这 种 口述 术 报 文 协议 使 用 了 肯 定 确认 (positive acknowledg- 
ment) (“OK”) 与 否定 确认 (negative acknowledgment) (“请 重复 一 裔 ”)。 这 些 控 制 报 文 
使 得 接收 方 可 以 让 发 送 方 知道 哪些 内 容 被 正确 接收 ， 哪 些 内 容 接收 有 误 并 因此 需要 重复 。 在 
计算 机 网 络 环境 中 ， 基 于 这 样 重 传 机 制 的 可 徘 数据 传输 协议 称 为 自动 重 传 请 求 (Automatic 
Repeat reQuest, ARQ) 协议 。 

ERE, ARQ 协议 中 还 需要 男 外 三 种 协议 功能 来 处 理 存在 比特 差错 的 情况 : 


rdt_send(data) 


packet=make pkt(data) 
udt send(packet) 





rdt_rcv(packet) 


extract (packet,data) 
deliver data(data) 





图 3-9 ”rdtl.0: 用 于 完全 可 靠 信道 的 协议 
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© 差错 检测 。 首 先 ， 需 要 一 种 机 制 以 使 接收 方 检测 到 何 时 出 现 了 比特 差错 。 前 一 节 


讲 到 ，UDP 使 用 因特网 检验 和 字段 正 是 为 了 这 个 目的 。 在 第 5 章 中 ， 我 们 将 更 详 
细 地 学 习 差 销 检 测 和 纠 钳 技 术 。 这些 技术 使 接收 方 可 以 检测 并 可 能 纠正 分 组 中 的 
比特 差错 此刻， 我 们 只 需 知 道 这 些 技术 要 求 有 额外 的 比特 (除了 待 发 送 的 初始 
数据 比特 之 外 的 比特 ) 从 发 送 方 发 送 到 接收 方 ; 这 些 比特 将 被 汇集 在 rdt 2.0 数据 
分 组 的 分 组 检验 和 字段 中 。 

接收 方 反馈 。 因 为 发 送 方 和 接收 方 通 弟 在 不 同 端 系统 上 执行 ， 可 能 相隔 数 干 英里 ， 
发 送 方 要 了 解 接收 方 情 况 (此 时 为 分 组 是 否 被 正确 接收 ) 的 唯一 途径 就 是 让 接收 
方 提供 明确 的 反馈 信息 给 发 送 方 。 在 口述 报 文 情 况 下 回答 的 “肯定 确认 ” (ACK) 
和 “否定 确认 ”(NAK) 就 是 这 种 反馈 的 例子 。 nde 我 们 的 rdt 2.0 协议 将 从 
接收 方 回 发 送 方 回 送 ACK 与 NAK 分 组 。 理 论 上 ， 这 些 分 组 只 需要 一 个 比特 长 ; 
如 用 0 表示 NAK， 用 1 表示 ACK, 

重 传 。 接 收 方 收 到 有 差错 的 分 组 时 ， 发 送 方 将 重 传 该 分 组 文 。 


图 3-10 说 明了 表示 rdt 2.0 的 FSM， 该 数据 传输 协议 采用 了 差错 检测 、 肯 定 确认 与 否 
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rdt_send(data) 


sndpkt=make pkt(data,checksum) 
udt send(sndpkt ) 


rdt_rcv(rcevpkt) ká isNAK(rcvpkt) 


udt_send(sndpkt) 


rdt_rev(rcevpkt) &6& isACK(rcvpkt) 
A 
a) rdt2.0: 发 送 端 


rdt rcv{(rcvpkt) gh corruptircvpkt) 






sndpkt=make pkt(NAK) 
udt sendi{sndpkt ) 


rdt rcv(rcvpkt) 66 notcorrupt (rcvpkt) 


extract{(rcvpkt ,data) 
deliver data(data) 
sndpkt=make pkt (ACK) 
udt_send(sndpkt) 


b) rdt2.0: 接收 端 
图 3-10 ”rdt 2.0: 用 于 具有 比特 差错 信道 的 协议 
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rdt 2. 0 的 发 送 病 有 两 个 状态 。 在 最 左边 的 状态 中 ， 发 送 端 协议 正 等 竺 来 月 上 层 传 下 来 
的 数据 ， 当 产生 rdt_send( data) 事件 时 ， 发 送 方 将 产生 一 个 包含 竺 发送 数 据 的 分 组 (sndpkt ) , 
带 有 检验 和 (例如 ， 就 像 在 3. 3. 2 节 讨 论 的 对 UDP 报 文 段 使 用 的 方法 ) ， 然 后 经 由 udt 
send( sndpkt) 操作 发 送 该 分 组 。 在 最 右边 的 状态 中 ,发送 方 协议 等 竺 来 和 目 接收 方 的 ACK 或 
NAK 分 组 ， 如 果 收 到 一 个 ACK 分 组 (图 3-10 中 符号 rdt_rcv( revpkt) && isACK( revpkt) 对 
应 该 事件 ) ， 则 发 送 方 知道 最 近 发 送 的 分 组 已 被 正确 接收 ， 因 此 协议 返回 到 等 待 来 自虐 层 
的 数据 的 状态 。 如 果 收 到 一 个 NAK 分 组 ， 该 协议 重 传 最 后 一 个 分 组 并 等 待 接收 方 为 啊 应 
重 传 分 组 而 回 送 的 ACK 和 NAK。 注 意 到 下 列 事实 很 重要 :， 当 发 送 方 处 于 等 待 ACK 或 NAK 
的 状态 时 ， 它 不 能 从 上 层 获得 更 多 的 数据 ; 这 就 是 说 ，rdt_send() 事件 不 可 能 出 现 ; (X 
接收 到 ACK 并 离开 该 状态 时 才能 发 生 这 样 的 事件 。 因此， 发 送 方 将 不 会 发 送 一 块 新 数据 ， 
除非 发 送 方 确信 接收 方 已 正确 接收 当前 分 组 。 由 于 这 种 行为 ，rdt 2.0 这 样 的 协议 被 称 为 停 
等 (stop-and-wait) 协议 - 
rdt 2.0 接收 方 的 FSM 仍然 只 有 一 个 状态 。 当 分 组 到 达 时 ， 接 收 方 要 么 回答 一 个 ACK， 
要 么 回答 一 个 NAKE， 这 取决 于 收 到 的 分 组 是 否 受 损 . 在 图 3-10 中 ， 符 号 rdt_rev( revpkt) 
&& corrupt( rcvpkt ) 对 应 于 收 到 一 个 分 组 并 发 现 有 和 错 的 事件 ， 
rdt 2. 0 协议 看 起 来 似乎 可 以 运行 六， 但 遗憾 的 是 ， 它 存在 一 个 致命 的 缺陷 。 尤 其 是 我 
们 没有 考虑 到 ACK 或 NAK 分 组 受 损 的 可 能 性 ! (在 继续 研究 之 前 ， 你 应 该 考虑 怎样 解决 
该 问题 ,) 遗憾 的 是 ， 我 们 细小 的 中 忽 并 非 像 它 看 起 来 那么 元 关 紧 杰 至少， 我 们 需要 在 
ACK/NAK 分 组 中 添加 检验 和 比特 以 检测 这 样 的 差错 。 更 难 的 问题 是 协议 应 该 怎样 纠正 
ACK 或 NAK 分 组 中 的 差错 。 这 里 的 难点 在 于 ， 如 果 一 个 ACK 或 NAK 分 组 受 损 ， 发 送 方 
无 法 知道 接收 方 是 否 正 确 接收 了 上 一 块 发 送 的 数据 . 
考虑 处 理 受 损 ACK 和 NAK 时 的 3 种 可 能 性 : 
。 对 于 第 一 种 可 能 性 ， 考 虑 在 口述 报 文 情况 下 人 可 能 的 做 法 。 如 果 说 话 者 不 理解 来 
日 接 收 方 回答 的 “OK” 或 “请 重复 一 人 融 ”， 说 话 者 将 可 能 问 “ 你 说 什么 ?”( 因 此 
在 我 们 的 协议 中 引入 了 一 种 新 型 发 送 方 到 接收 方 的 分 组 ) 。 接 收 方 则 将 复述 其 回 
答 ,， 但 是 如 果 说 话 者 的 “你 说 什么 ”产生 了 差错 ， 情 况 又 会 怎样 呢 ” 接 收 者 不 明 
白 那 句 混 请 的 话 是 口述 内 容 的 一 部 分 还 是 一 个 要 求 重 复 上 次 回答 的 请 求 ， 很 可 能 
回 一 名 “你 说 什么 ?”。 于是， 该 回答 可 能 含糊 不 清 了 。 显 然 ， 我 们 走 上 了 一 条 困 
难 重 重 之 路 . 
e 第 二 种 可 能 性 是 增加 足够 的 检验 和 比特 ， 使 发 送 方 不 仅 可 以 检测 差错 ， 还 可 恢复 
差错 。 对 于 会 产生 差 铺 但 不 丢失 分 组 的 信道 ， 这 就 可 以 直接 解决 问题 。 
© 第 三 种 方法 是 ， 当 发 送 方 收 到 含糊 不 清 的 ACK 或 NAK 分 组 时 ， 只 需 重 传 当 前 数 
据 分 组 即 可 。 然 而 ， 这 种 方法 在 发 送 方 到 接收 方 的 信道 中 引入 了 元 余 分 组 (dupli- 
cate packet) 。 宛 余 分 组 的 根本 困难 在 于 接收 方 不 知道 它 上 次 所 发 送 的 ACK 或 NAK 
是 否 被 发 送 方正 确 地 收 到 。 因 此 它 无 法 事先 知道 接收 到 的 分 组 是 新 的 还 是 一 次 
重 传 ! 
解决 这 个 新 问题 的 一 个 简单 方法 ( 几乎 所 有 现 有 的 数据 传输 协议 中 ， 包 括 TCP， 都 采 
用 了 这 种 方法 ) 是 在 数据 分 组 中 添加 一 新 字段 ， 让 发 送 方 对 其 数据 分 组 编号 ， 即 将 发 送 数 
据 分 组 的 序号 (sequence number) 放 在 该 字段 。 于 是 ， 接 收 方 只 需要 检查 序号 即 可 确定 收 
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到 的 分 组 是 否 一 次 重 传 ”对 于 停 等 协议 这 种 简单 情况 ，1 eR SS eee, AA Te 
接收 方 知道 发 送 方 是 否 正 在 poets 发 送 分 组 (接收 到 的 分 组 序号 与 最 近 收 到 的 分 组 序 
号 相同 ) ， 或 是 一 个 新 分 组 (序号 变化 了 , 用 模 2 运算 “前 回 ” 移 动 ) 因为 目前 我 们 假 
定 信 过 不 天 分 组 ，ACK 和 | i 指明 它们 要 确认 的 分 组 序 写 。 友 大 方 知 道 
所 接收 到 的 ACK 和 NAK 分 组 〈 无 论 是 否 是 含糊 不 清 的 ) 是 为 啊 应 其 最 近 发 送 的 数据 分 组 
而 生成 的 
[13-11 AIA] 3-12 给 出 了 对 rdt 2.1 的 FSM E, XE rdt 2.0 的 修 呆 版 。rdt 2.1 的 发 
送 方 和 接收 方 FSM 的 状态 数 都 是 以 前 的 两 倍 。 这 是 因为 协议 状态 此 时 必须 反映 出 目前 
(由 发 送 方 ) 正 发 送 的 分 组 或 〈 在 接收 方 ) 希望 接收 的 分 组 的 序号 是 0 还 是 1。 值 得 注意 
的 是 ， 发 送 或 期 望 接收 0 号 分 组 的 状态 中 的 动作 与 发 送 或 期 望 接收 1 号 分 组 的 状态 中 的 动 
作 是 相似 的 ; 唯一 的 不 同 是 序号 处 理 的 方法 不 同 . 
rdt send(data) 


sndpkt=make pkt(0,data,checksum) 
udt send(sndpkt) 


rdt_rcev(rcvpkt)6é 
(corrupt (revpkt ) | | 
isNAK(rcvpkt )) 








eben udt send(sndpkt) 
调用 0 
rdt_rev(rcvpkt) o rdt rev(rcvpkt) 
&& notcorrupt(rcvpkt && NOotcorrupt(rcvpkt ) 
bb isACK(rcvpkt ) éé 18ACK( rcvpkt) 
A A 


rdt_rcev(rcvpkt)&6 
{corrupt (rcvpkt) | | 
isNAK(rcvpkt)) 





udt_send{sndpkt ) rdt_send(data) 


sndpkt»make pkt(1,data,checksum) 
udt_send(sndpkt ) 


图 3-11 rdt2.1 发 送 方 


协议 rdt 2. 1 使 用 了 从 接收 方 到 发 送 方 的 肯定 确认 和 和 否定 确认 。 当 接收 到 失 序 的 分 组 
时 ， 接 收 方 对 所 接收 的 分 组 发 送 一 个 肯定 确认 。 如 果 收 到 受 损 的 分 组 ， 则 接收 方 将 发 送 一 
个 否定 确认 。 如 果 不 发 送 NAK， 而 是 对 上 次 正确 接收 的 分 组 发 送 一 个 ACK， 我 们 也 能 实 
HE NAK 一 样 的 效果 -。 发 送 方 接收 到 对 同一 个 分 组 的 两 个 ACK ( 即 接收 元 余 ACK 
(duplicate ACK) ) 后 ， 就 知道 接收 方 没有 正确 接收 到 跟 在 被 确认 两 次 的 分 组 后 面 的 分 组 . 
rdt 2. 2 是 在 有 比特 差错 信道 上 实现 的 一 个 无 NAK 的 可 靠 数据 传输 协议 ， 如 图 3-13 和 图 3-14 
Aras. rdt2. 1 和 rdt2.2 之 间 的 细微 变化 在 于 ， 接 收 方 此 时 必须 包括 由 一 个 ACK 报 文 所 确 
认 的 分 组 序号 (这 可 以 通过 在 接收 方 FSM F, Œ make_pkt() 中 包括 参数 ACK 0 或 ACK 1 
来 实现 ) ， 发 送 方 此 时 必须 检查 接收 到 的 ACK 报 文中 被 确认 的 分 组 序号 (这 可 通过 在 发 送 
方 FSM 中 , 在 isACK() 中 包括 参数 0 或 1 来 实现 ) - 
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rdt_rev(rcvpkt)&& notcorrupt(rcvpkt) 
&& has_seg0(revpkt) 
extract(rcvpkt,data) 
deliver data(data) 
andpktemake pkt (ACK, checksum) 
rdt_rev(revpkt) udt_send(sndpkt ) rdt_rcev(rcevpkt) && corrupt (rcvpkt) 









&& Corrupt (rcevpkt 
pt (rcvpkt ) sndpkt=make_pkt (NAK, checksum) 


sndpkt=make_pkt (NAK, checksum) udt_send(sndpkt ) 


udt_send(sndpkt ) 


rdt_rev({rcvpkt)&& notcorrupt 
(rcvpkt )&éhas_ seql(rcvpkt) 





sndpkt=make_ pkt (ACK, checksum) 
udt_send(sndpkt ) rdt_rev(rcvpkt)&6& notcorrupt 


(rcevpkt)&éhas seq0(rcvpkt) 
rdt_rev(rcevpkt) 6&6 notcorrupt(revpkt) 
&& has _seql(revpkt) sndpkt=make_pkt (ACK, checksum) 


udt send(sndpkt) 





extract (rcvpkt, data) 

deliver dataj{data) 
sndpkt=make_pkt (ACK, checksum) 
udt send(sndpkt ) 


图 3-12 rdt 2.1 接收 方 


rdt send(data) 


sndpkt=make pkt(0,data,checksum) 
udt send(sndpkt ) 


rdt rev(rcvpkt) && 
(corrupt(revpkt ) | | 
isACKircvpkt,1)) 


udt send(sndpkt ) 







rdt_rev(rcevpkt) 
&& notcorrupt(revpkt ) 
&& 1SACK(rcvpkt,1) 


A 


rdt_rev(rcvpkt) 
&& notcorrupt(revpkt) 
&& isACK( rcvpkt,0) 


A 


rdt_rev(rcvpkt) bs 
(corrupt(rcevpkt) | | 
isACK(rcvpkt,0)) 


rdt send(data) 


udt send(sndpkt) 


sndpkt»make pkt(1,data,checksum) 
udt send(sndpkt) 


图 3-13 rdt 2.2 发 送 方 


3. 经 具有 比特 差错 的 丢 包 信道 的 可 笔 数据 传 簿 : rdt 3. 0 
现在 假定 除了 比特 受 损 外 ， 底 层 信道 还 会 丢 包 ， 这 在 今天 的 计算 机 网 络 (包括 因 特 
网 ) 中 并 不 罕见 。 协 议 现 在 必须 处 理 另 外 两 个 关注 的 问题 : 怎样 检测 丢 包 以 及 发 生 丢 包 后 
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该 做 些 什么 。 在 rdt 2. 2 中 已 经 研发 的 技术 ， 如 使 用 检验 和 、 序 号 、ACK 分 组 和 重 传 等 ， 使 
我 们 能 给 出 后 一 个 问题 的 答案 。 为 解决 第 一 个 关注 的 问题 ， 还 需 增 加 一 种 新 的 协议 机 制 。 


rdt_rev(revpkt) && notcorrupt(rcvpkt ) 
&& has seq0(rcevpkt) 


extract (rcevpkt,data) 

deliver data({data) 

sndpkt«make pkt(ACK,0,checksum) 
udt send(sndpkt ) 


rdt_rcev(rcvpkt) 66 
(corrupt(revpkt) | | 
has seq0(rcevpkt )} 







sndpkt=make pkt(ACK,0, 
checksum) udt_send(sndpkt) 


rdt_rcev(rcvpkt) 6& 
(corrupt (revpkt) | | 
has_seqi(rcevpkt) ) 


sndpkt»make pkt(ACK,1,checksum} 
udt_send(sndpkt) 


rdt_rev(rcevpkt) á notcorrupt(rcevpkt) 
&& has seql(revpkt) 


extract ({rcvpkt,data)} 

deliver data(data) 

sndpkt«make pkt(ACK,1,checksum) 
udt_send(sndpkt) 


图 3-14 rdt 2.2 接收 方 


这 里 ， 我 们 让 发 送 方 负责 检测 和 恢复 丢 包 工作 。 假 定 发 送 方 传输 一 个 数据 分 组 ， 该 分 组 或 
者 接收 方 对 该 分 组 的 ACK 发 生 了 丢失 。 在 这 两 种 情况 下 ， 发 送 方 都 收 不 到 应 当 到 来 的 接 
收 方 的 啊 应 。 如 果 发 送 方 愿意 等 待 足 够 长 的 时 间 以 便 确定 分 组 已 丢失 ， 则 它 只 需 重 传 该 数 
据 分 组 即 可 。 你 应 该 相信 该 协议 确实 有 效 。 

但 是 发 送 方 需要 等 待 多 久 才能 确定 已 丢失 了 某 些 东西 呢 ? 很 明显 发 送 方 至 少 需要 等 待 
这 样 长 的 时 间 : 即 发 送 方 与 接收 方 之 间 的 一 个 往返 时 延 (可 能 会 包括 在 中 间 路 由 器 的 缓冲 
时 延 ) 加 上 接收 方 处 理 一 个 分 组 所 需 的 时 间 。 在 很 多 网 络 中 ， 最 坏 情 况 下 的 最 大 时 延 是 很 
难 估算 的 ， 确 定 的 因素 非常 少 。 此 外 ， 理 想 的 协议 应 尽 可 能 快 地 从 丢 包 中 恢复 出 来 ; 等 待 
一 个 最 坏 情况 的 时 延 可 能 意味 着 要 等 待 一 段 较 长 的 时 间 ， 直 到 启动 差错 恢复 为 止 。 因 此 实 
践 中 采取 的 方法 是 发 送 方 明 智 地 选择 一 个 时 间 值 ， 以 判定 可 能 发 生 了 丢 包 (尽管 不 能 确 
保 ) 。 如 果 在 这 个 时 间 内 没有 收 到 ACK， 则 重 传 该 分 组 。 注 意 到 如 果 一 个 分 组 经 历 了 一 个 
寺 别 大 的 时 延 ， 发 送 方 可 能 会 重 传 该 分 组 ， 即 使 该 数据 分 组 及 其 ACK 都 没有 丢失 。 这 就 
在 发 送 方 到 接收 方 的 信道 中 引入 了 宛 余数 据 分 组 (duplicate data packet) 的 可 能 性 。 幸 运 
的 是 ，rdt 2. 2 协议 已 经 有 足够 的 功能 ( 即 序号 ) 来 处 理 宛 余 分 组 情况 。 

从 发 送 方 的 观点 来 看 ， 重 传 是 一 种 万 能 灵 药 。 发 送 方 不 知道 是 一 个 数据 分 组 丢失 ， 还 
是 一 个 ACK EK, 或 者 只 是 该 分 组 或 ACK 过 度 延 时 。 在 所 有 这 些 情 况 下 ， 动 作 是 同样 
的 : 重 传 。 为 了 实现 基于 时 间 的 重 传 机 制 ， 需 要 一 个 倒 计 数 定时 器 (countdown timer), ， 在 
一 个 给 定 的 时 间 量 过 期 后 ， 可 中 断 发 送 方 。 因 此 ， 发 送 方 需要 能 做 到 : 个 每 次 发 送 一 个 分 
组 (包括 第 一 次 分 组 和 重 传 分 组 ) 时 ， 便 启动 一 个 定时 器 。@ 响 应 定时 需 中 断 (OR Bad 
当 的 动作 ) 。 凶 终止 定时 器 。 

图 3-15 给 出 了 rdt 3.0 的 发 送 方 RM， 这 是 一 个 在 可 能 出 错 和 丢 包 的 信道 上 可 靠 传输 
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数据 的 协议 ; 在 课 后 习题 中 ， 将 请 你 提供 rdt 3.0 的 接收 方 FSM. [Kl 3-16 显示 了 在 没有 天 

包 和 延迟 分 组 情况 下 协议 运作 的 情况 ， 以 及 它 是 如 何 处 理 数据 分 组 丢失 的 。 在 图 3-16 P, 

时 间 从 图 的 项 部 组 撒 部 移动 ; 注意 到 一 个 分 组 的 接收 时 间 必 定 述 于 一 个 分 组 的 发 送 时 间 ， 

这 是 因为 发 送 时 延 与 传播 时 延 之 故 。 在 图 3-16b ~d P, 发 送 方 括 叶 部 分 表明 了 定时 需 的 

设置 时 刻 以 及 随后 的 超时 。 本 章 后 面 的 习题 探讨 了 该 协议 几 个 更 细微 的 方面 。 因 为 分 组 序 

号 在 0 和 1 之 间 交 替 ， 因 此 rdt 3.0 有 时 被 称 为 比特 交替 协议 (alternating- bit protocol ) . 
rdt_send(data) 


sndpkt=make pkt(0,data,checksum) 






udt_send(sndpkt ) rdt_rev(rcvpkt) 66 
start timer (corrupt (revpkt) | | 
isACK(rcvpkt,1)) 
A 
rdt_rcev(rcvpkt) 
A timeout 


udt_send(sndpkt) 
start timer 





rdt_rev(rcvpkt) 
&& notcorrupt (rcvpkt) 

&& isACK(rcevpkt,1)}) rdt_rev(rcvpkt) 
ae ae 66 notcorrupt (rcvpkt) 


stop timer 
P- && isACK(rcvpkt,0) 


timeout 
udt_send(sndpkt ) ( : = 
start timer = 


rdt_rev(rcvpkt) áá 
(corrupt(revpkt} | | 
isACK(revpkt,0)) 


A 


stop timer 


rdt_rev(rcvpkt) 


A 


rdt_send(data) 


sndpkt=make pkt(1,data,checksum) 
udt_send(sndpkt ) 
start timer 


图 3-15 rdt 3.0 发 送 方 


现在 我 们 归纳 一 下 数据 传输 协议 的 要 点 。 在 检验 和 、 序 号 、 定 时 带 、 肯 定 和 否定 确认 
分 组 这 些 技术 中 ， 每 种 机 制 都 在 协议 的 运行 中 起 到 了 必 不 可 少 的 作用 。 至 此 ， 我 们 得 到 了 
一 个 可 徘 数 据 传输 协议 ! 


3. 4.2 流水 线 可 靠 数 据 传输 协议 


rdt 3. 0 是 一 个 功能 正确 的 协议 , 但 并 非 人 人 都 对 它 的 性 能 满意 ， 特 别 是 在 今天 的 高 速 
网 络 中 更 是 如 此 。rdt 3.0 性 能 问题 的 核心 在 于 它 是 一 个 停 等 协议 。 

为 了 评价 该 停 等 行为 对 性 能 的 影响 ， 可 考虑 一 种 具有 两 台 主 机 的 理想 化 场合 ， 一 台 主 
机 位 于 美国 西海 岸 ， 另 一 台 位 于 美国 东海 岸 ， 如 图 3-17 所 示 。 在 这 两 个 端 系统 之 间 的 光 
速 往返 传播 时 延 RTT KAYA 30 毫秒。 假定 彼此 通过 一 条 发 送 速率 RR 为 1Gbps (每 秒 10 比 
特 ) 的 信道 相连 。 包 括 首 部 字段 和 数据 的 分 组 长 工 为 1000 字 节 (8000 比特 ) ， 发 送 一 个 
分 组 进入 1Cbps 链 路 实际 所 需 时 间 是 : 


L 8000bit/pkt 
t a = = 8 3/ kt 
mm R 10°bit/s lis 


发 送 方 接收 方 


发 送 分 组 0 : PKi0 : 
: ~: 接收 分 组 0 
nck Se: 发 送 ACK 0 
接收 ACK 0 : a : 


kt] 


发 送 分 组 1 ， : 
i 接收 分 组 1 
NO : 发 送 ACK | 

接收 ACK 1 : pe . 


发 送 分 组 0 : : 
Bi 接收 分 组 0 
发 送 ACK 0 


EA 
党 


a) 无 丢 包 操作 
发 送 方 接收 方 


发 送 分 组 0 、PKi0 


ee 接收 分 组 0 


So 发 送 ACK 0 
接收 ACK o: Pkto - 
PRR) TON i 接收 分组 1 


NOS : 发 送 ACK | 
超时 | :( 丢 失 )X : 
重 发 分 组 1 -: LAU 

oo 接收 分 组 1 

i A E BRACKI 

i E- : 发 送 ACK 1 
接收 ACK 1 : Pkto f 


发 送 分 组 0 - : 
id eao 
a : 发 送 ACK 0 


c) 丢失 ACK 


图 3-16 rdt 3.0 的 运行 ， 


”数据 分 组 


se + ji g 





a) 一 个 运行 中 的 停 等 协议 






发 送 方 接收 方 
发 送 分 组 0 :wkr0 
接收 ACK0  : Ch : 发 送 ACK 0 
BIE SY AA | ; ve 7 
I: me KEA) 
超时 | : 
重 发 分 组 1 ; 
| Pkt] 3 
接收 分 组 1 
| P 发 送 ACK | 
接收 ACK 1 : ekto 
送 分 组 0 ， | 
发 送 分 组 i Pr 
> : 发 送 ACK 0 
* b) 分 组 丢失 
发 送 方 接收 方 
Ko ”接收 分 组 0 
接收 ACK 0 ao 
Ram Se” BACK 
mam SE tees 
重 发 分 组 1 | pkt] opi: 发 送 ACK | 
>< 接收 分 组 1 
接收 ACK 1 : \ ORR IT AR 
发 送 分 组 0 : LO > 发送 ACK | 
: ~ 接收 分 组 0 
TRACK | : nde: 发送 ACK 0 
AWB ee 


> š 


d) 过 早 超时 
比特 交替 协议 





b) 一 个 运行 中 的 流水 线 协议 
图 3-17 停 等 协议 与 流水 线 协议 
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图 3-18a 显示 了 对 于 该 停 等 协 以 ， 如 果 发 送 方 在 上 =0 时 刻 开 始 发 送 分 组 ， 则 在 上 =ZAR= 
Sus 后 ， 最 后 1 比特 数据 进入 了 发 送 闪 信道。 该 分 组 经 过 15ms 的 穿越 国家 的 旅途 后 到 达 接 
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收 端 ， 该 分 组 的 最 后 1 比特 在 时 刻 上 = RTT/2 + L/R = 15. 008ms 时 到 达 接 收 方 。 为 了 简化 起 
见 ， 假 设 ACK 分 组 很 小 〈 以 便 我 们 可 以 忽略 其 发 送 时 间 ) ， 接 收 方 一 旦 收 到 一 个 数据 分 组 
的 最 后 | 比特 后 立即 发 送 ACK, ACK 在 时 刻 上 = RTT + L/R =30. 008ms 时 在 发 送 方 出 现 。 
此 时 ， 发送 方 可 以 发 送 下 一 个 报 文 。 因 此 ， 在 30.008ms A, 发送 方 的 发 送 只 用 了 
0. 008ms。 如 果 我 们 定义 发 送 方 (或 信道 ) 的 利用 率 (utilization) 为 : 发 送 方 实际 忙于 将 
发 送 比 特 送 进 信道 的 那 部 分 时 间 与 发 送 时 间 之 比 ， 图 3-18a 中 的 分 析 表 明了 停 等 协议 有 着 
非常 低 的 发 送 方 利用 率 U ender: 












y uR _ 0. E 
-RTT 
发 送 方 
首 个 分 组 的 第 1 个 & = en 
比特 被 传输 ，/=0 一 一 一 一 一 一 i 
首 个 分 组 的 最 后 1 比特 EE ~ ; 
被 传输 ，i=L/R : 
a MM 首 个 分 组 的 第 1 个 比特 到 达 
RIT + : SS: 首 个 分 组 的 最 后 1 个 比特 到 达 ， 发 送 ACK 
ACK 到 达 ， 发 送 下 一 个 分 组 ， | Ua cna E: 
t=RTT + L/R : 
a) 停 等 操作 
首 个 分 组 的 第 1 个 
比特 被 发 送 ， {=0 : 
首 个 分 组 的 最 后 1 比特 一 一 一 
被 发 送 ，/=L/R 


一 首 个 分 组 的 第 1 个 比特 到 达 

一 首 个 分 组 的 最 后 1 个 比特 到 达 ， 发 送 ACK 
一 第 2 个 分 组 的 最 后 1 个 比特 到 达 ， 发 送 ACK 
:一 第 3 个 分 组 的 最 后 1 个 比特 到 达 ， 发 送 ACK 


RTT 


ACK 到 达 ， 发 送 下 一 个 分 组 ， 一 ~: 
1=RTT+L/R 一 ,证 到 





b) 流水 线 操作 
图 3-18 停 等 和 流水 线 发 送 


Z h Z we 


这 就 是 说 ， 发 送 方 只 有 万 分 之 2.7 时 间 是 忙 的 。 从 其 他 角度 来 看 ， 发 送 方 在 30. 008ms 
内 只 能 发 送 1000 字 节 ， 有 效 的 吞吐 量 仅 为 267kbps， 即 使 有 1Cbps 的 链 路 可 用 ! 想象 一 个 
不 幸 的 网 络 经 理 购 买 了 一 条 千 兆 比 容量 的 链 路 ， 但 他 仅 能 得 到 267kbps Fit EAO! 这 
是 一 个 形象 的 网 络 协 议 限制 底层 网 络 便 件 所 提供 的 能 力 的 示例 。 而 且 ， 我 们 还 忽略 了 在 发 
送 方 和 接收 方 的 底层 协议 处 理 时 间 ， 以 及 可 能 出 现在 发 送 方 与 接收 方 之 间 的 任何 中 间 路 由 
器 上 的 处 理 与 排队 时 延 。 考 虑 到 这 些 因 素 ， 将 进一步 增加 时 延 ， 使 其 性 能 更 糟糕 。 
解决 这 种 特殊 的 性 能 问题 的 一 个 简单 方法 是 : 不 使 用 停 等 方式 运行 ， 允 许 发 送 方 发 送 
多 个 分 组 而 无 震 等 待 确认， 如 在 网 3-17b 图 示 的 那样 。 图 3-18b 显示 了 如 琳 发 送 方 可 以 在 
等 待 确认 之 前 发 送 3 个 报 文 ， 其 利用 率 也 基本 上 提高 3 倍 。 因 为 许多 从 发 送 方 回 接收 方 输 
送 的 分 组 可 以 被 看 成 是 填充 到 一 条 流水 线 中 ， 故 这 种 拉 术 被 称 为 流水 线 (pipelining). fit 
水 线 技术 对 可 徘 数 据 传输 协议 可 市 来 如 下 影响 : 
e 必须 增加 序号 范围 ， 因 为 每 个 输送 中 的 分 组 (不 计算 重 传 的 ) 必须 有 一 个 唯一 的 
序号 ， 而 且 也 许 有 多 个 在 输送 中 未 确认 的 报 文 。 
© 协议 的 发 送 方 和 接收 方 两 应 也 许 必 须 缓存 多 个 分 组 。 发 送 方 最 低 限 度 应 当 能 缓冲 
那些 已 发 送 但 没有 确认 的 分 组 .如 下 面 讨 论 的 那样 ， 接 收 方 或 许 也 需要 缓存 那些 
已 正确 接收 的 分 组 。 
e。 所 需 序号 范围 和 对 缓冲 的 要 求 取 决 于 数据 传输 协议 如 何 处 理 丢 失 、 损 坏 及 延 时 过 
大 的 分 组 。 解 决 流水 线 的 差错 恢复 有 两 种 基本 方法 是 : 回 退 NN 步 ( Go- Back-N, 
CBN) 和 选择 重 传 (Selective Repeat, SR). 


3.4.3 RNY 


在 回 退 NZ (CBN) 协议 中 ， 人 允许 发 送 方 发 送 多 个 分 组 ( 当 有 多 个 分 组 可 用 时 ) 而 
不 需 等 竺 确认 ,但 它 也 受 限于 在 流水 线 中 未 确认 的 分 组 数 不 能 超过 菏 个 最 大 允许 数 NN。 在 
本 节 中 我 们 较为 详细 地 描述 GBN。 但 在 继续 阅读 之 前 ， 建 议 你 操作 本 书 配套 Web 网 站 上 
的 CBN Java 小 程序 (这 是 一 个 非常 好 的 Java 程序 )。 

图 3-19 显示 了 发 送 方 看 到 的 CBN 协议 的 序号 范围 。 如 果 我 们 将 基 厅 号 (base) 定义 
为 最 早 的 未 确认 分 组 的 序号 ， 将 下 一 个 序号 (nextseqnum) 定义 为 最 小 的 未 使 用 序号 〈 即 
下 一 个 待 发 分 组 的 序号 ) ， 则 可 将 序号 范围 分 割 成 4 段 。 在 [0，base -1」 段 内 的 序号 对 
应 于 已 经 发 送 并 被 确认 的 分 组 。[ base，nextseqnum -1] 段 内 对 应 已 经 发 送 但 未 被 确认 的 
分 组 。[ nextseqnum，base +N -1] 段 内 的 序号 能 用 于 那些 要 被 立即 发 送 的 分 组 ， 如 果 有 
数据 来 自 上 层 的 话 。 最 后 ， 大 于 或 等 于 base + N 的 序号 是 不 能 使 用 的 ， 直 到 当前 流水 线 中 
未 被 确认 的 分 组 (特别 是 序号 为 base 的 分 组 ) 已 得 到 确认 为 止 。 





基 序 号 FTRS 
(base) (nextseqnum) 





窗口 长 
N 





发 送 ， 还 未 
国人 [| 


图 3-19 在 GBN 中 发 送 方 看 到 的 序号 
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如 图 3-19 所 提示 的 那样 ， 那 些 已 被 发 送 但 还 未 被 确认 的 分 组 的 许可 序号 范围 可 以 被 
看 成 是 一 个 在 序号 范围 内 长 度 为 N 的 窗口 。 随 着 协议 的 运行 ,该 窗口 在 序号 空间 向 前 滑 
动 。 因 此 ,WN 第 被 称 为 窗口 长 度 (window size), GBN 协议 也 第 被 称 为 滑动 窗口 协议 
( sliding- window protocol) 。 你 也 许 想 知道 ， 我 们 为 什么 先 要 限制 这 些 被 发 送 的 、 未 被 确认 
的 分 组 的 数目 为 N 呢 ? 为 什么 不 允许 这 些 分 组 为 无 限制 的 数目 呢 ? 我 们 将 在 3.5 节 看 到 ， 
流量 控制 是 对 发 送 方 施加 限制 的 原因 之 一 。 我们 将 在 3.7 市 学 习 TCP 拥 压 控制 时 分 析 另 一 
个 原因 。 

在 实践 中 ， 一 个 分 组 的 序号 承载 在 分 组 首部 的 一 个 固定 长 度 的 字段 中 。 如 果 分 组 序号 
字段 的 比特 数 是 上， 则 该 序号 范围 是 [0，2 -1]。 在 一 个 有 限 的 序号 范围 内 ， 所 有 涉及 序 
号 的 运算 必须 使 用 模 2 运算 。 ( 即 序号 空间 可 被 看 作 是 一 个 长 度 为 2 的 环 ， 其 中 序号 
2 -1 紧 接着 序号 0。) 前 面 讲 过 ，rdt 3. 0 有 一 个 1 比特 的 序号 ， 序 号 范围 是 [0，1] 。 在 
本 章 末 的 几 道 习题 中 探讨 了 一 个 有 限 的 序号 泡 围 所 产生 的 结果 。 我 们 将 在 3.5 节 看 到 ， 
TCP 有 一 个 32 比特 的 序号 字段 ， 其 中 的 TCP 序号 是 按 字 节 流 中 的 字 节 进行 计数 的 ， 而 不 
是 按 分 组 计数 。 

图 3-20 和 图 3-21 给 出 了 一 个 基于 ACK、 无 NAK 的 CBN 协议 的 发 送 方 和 接收 方 这 两 
wR FSM 描述 。 我 们 称 该 PSM 描述 为 扩展 FSM， 是 因为 我 们 已 经 增加 了 变量 (类似 
于 编程 语言 中 的 变量 ) base 和 nextseqnum， 还 增加 了 对 这 些 变 量 的 操作 以 及 与 这 些 变 量 有 
关 的 条 件 动作 。 注 意 到 该 扩展 的 FSM 规约 现在 变 得 有 点 像 编 程 语言 规约 。 | Bochman 
1984] 对 FSM 扩展 技术 提供 了 一 个 很 好 的 综述 ， 也 提供 了 用 于 定义 协议 的 其 他 基于 编程 
语言 的 技术 。 

rdt_send(data) 


if (nextseqnum<basesn ) { 
sndpkt[nextseqnum)=make pkt (nextseqnum,data,checksum) 
udt_send(sndpkt[nextseqnum) ) 


if (base==nextseqnum) 
à start_timer 
A Sse nextseqnum++ 
base=1 ~~、 } 
nextseqnum=1 Ot else 
a refuse_data(data) 
ia 
ky 


timeout 


start timer 

udt_send( sndpkt[base})) 
udt_send(sndpkt[base+1 } ) 
rdt_rev(rcvpkt) &6@ corrupt (revpkt) 


A udt_send(sndpkt [ nextseqnum-1]) 





rdt_rcv(rcevpkt) && notcorrupt({rcvpkt) 


base=-getacknum(rcvpkt)+1 
If (base=--nextseqnum) 
stop_timer 
else 
start timer 


图 3-20 CBN 发 送 方 的 扩展 FSM 描述 
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(N 


rdt revircvpkt) 
&& notcorrupt(revpkt) 
&& hasseqnum( rcvpkt,expectedseqnum } 


extract (revpkt,data) 

deliver data(data) 

sndpkt=make pkt{expectedseqnum,ACK, checksum) 
udt_send(sndpkt ) 

expectedseqnum++ 





default 
A udt send(sndpkt) 
expectedseqnum=1 





sndpkt=make_ pkt(0,ACK,checksum) 
图 3-21 GBN 接收 方 的 扩展 FSM 描述 


CBN 发 送 方 必 须 啊 应 三 种 类 型 的 事件 : 

e 上 层 的 调用 。 当 上 层 调 用 rdt_send() 时， 发 送 方 首 先 检查 发 送 和 窗口 是 否 已 满 ， 即 是 
RA N 个 已 发 送 但 未 被 确认 的 分 组 。 如 果 窗 口 未 满 ， 则 产生 一 个 分 组 并 将 其 发 送 ， 
并 相应 地 更 新 变量 。 如 果 窗 口 已 满 ， 发 送 方 只 需 将 数据 返回 给 上 层 ， 隐 式 地 括 示 
上 层 该 窗口 已 满 。 然 后 上 层 可 能 会 过 一 会 儿 再 试 。 在 实际 实现 中 ， 发 送 方 更 可 能 
缓存 (并 不 立刻 发 送 ) 这 些 数 据 ， 或 者 使 用 同步 机 制 ( 如 一 个 信号 量 或 标志 ) È 
许 上 层 在 仅 当 窗口 不 满 时 才 调 用 rdt_send() 。 

e 收 到 一 个 ACK, 在 GBN 协议 中 ， 对 序号 为 n 的 分 组 的 确认 采取 累积 确认 〈cumu- 
lative acknowledgment) 的 方式 ， 表明 接收 方 已 正确 接收 到 序号 为 n 的 以 前 且 包 括 n 
在 内 的 所 有 分 组 。 稍 后 讨论 CBN 接收 方 一 并 时 ， 我 们 将 再 次 钱 究 这 个 主题 。 

e 超时 事件 。 协 议 的 名 字 “ 回 退步 ”来 源 于 出 现 丢 失 和 时 延 过 长 分 组 时 发 送 方 的 
行为 。 就 像 在 停 等 协议 中 那样 ， 定 时 规 将 再 次 用 于 恢复 数据 或 确认 分 组 的 丢失 。 
如 果 出 现 超时 ， 发 送 方 重 传 所 有 已 发 送 但 还 未 被 确认 过 的 分 组 。 图 3-20 中 的 发 送 
方 仅 使 用 一 个 定时 器 ， 它 可 被 当 作 是 最 早 的 已 发 送 但 未 被 确认 的 分 组 所 使 用 的 定 
时 器 。 如 果 收 到 一 个 ACK， 但 仍 有 已 发 送 但 未 被 确认 的 分 组 ， 则 定时 带 被 重新 局 
动 。 如 果 没 有 已 发 送 但 未 被 确认 的 分 组 ， 该 定时 器 被 终止 。 

在 CBN 中 ， 接 收 方 的 动作 也 很 简单 。 如 果 一 个 序号 为 n 的 分 组 被 正确 接收 到 ,并且 
按 序 ( 即 上 次 交付 给 上 层 的 数据 是 序号 为 n -1 的 分 组 )， 则 接收 方 为 分 组 n 发 送 一 个 
ACK， 并 将 该 分 组 中 的 数据 部 分 交付 到 上 层 。 在 所 有 其 他 情况 下 ， 接 收 方 丢 弃 该 分 组 ， 并 
为 最 近 按 序 接收 的 分 组 重新 发 送 ACK。 注 意 到 因为 一 次 交付 给 上 层 一 个 分 组 ， 如 宁 分 组 天 
已 接收 并 交付 ， 则 所 有 序号 比 k 小 的 分 组 也 已 经 交付 。 因 此 ， 使 用 累积 确认 是 CBN 一 个 
目 然 的 选择 。 

在 CBN 协议 中 ， 接 收 方 丢 弃 所 有 失 序 分 组 。 尺 管 丢 弃 一 个 正确 接收 (但 失 序 ) 的 分 
组 有 点 思春 和 浪费 ， 但 这 样 做 是 有 理由 的 。 前 面 讲 过 ， 接 收 方 必 须 按 序 将 数据 交付 给 上 
层 。 假 定 现在 期 望 接 收 分 组 n， 而 分 组 n+1 却 到 了 。 因 为 数据 必须 按 序 交 付 ， 接 收 方 可 能 
缓存 (保存 ) 分 组 n+1， 然 后 ， 在 它 收 到 并 交付 分 组 n 后 ,再 将 该 分 组 交付 到 上 层 。 然 
而 ， 如 果 分 组 n 丢失 ， 则 该 分 组 及 分 组 n+1 最 终 将 在 发 送 方 根据 CBN 重 传 规则 而 被 重 


传 。 因 此 ， 接 收 方 只 需 丢 弃 分 组 n+1 即 可 。 这 种 方法 的 优点 是 接收 缓存 简单 ， 即 接收 方 
不 需要 缓 仓 任何 失 序 分 组 。 因 此 ， 虽 然 发 送 方 必须 维护 窗口 的 上 下 边界 及 nextseqnum 在 该 
窗口 中 的 位 置 ， 但 是 接收 方 需要 维护 的 唯一 信息 就 是 下 一 个 按 序 接收 的 分 组 的 序号 。 该 什 
保存 在 expectedseqnum 变量 中 ， 如 图 3-21 中 接收 方 FSM 所 示 。 当 然 ， 于 弃 一 个 正确 接收 
的 分 组 的 缺点 是 随后 对 该 分 组 的 重 传 也 许 会 丢失 或 出 错 ， 因 此 甚至 需要 更 多 的 重 传 。 

图 3-22 给 出 了 窗口 长 度 为 4 个 分 组 的 CBN 协议 的 运行 情况 。 因 为 该 窗口 长 度 的 限制 ， 
发 送 方 发 送 分 组 0 ~3， 然 后 在 继续 发 送 之 前 ， 必 须 等 待 直 到 一 个 或 多 个 分 组 被 确认 。 当 接 
收 到 每 一 个 连续 的 ACK (例如 ACK 0 和 ACK 1) 时 ,该 窗口 便 向 前 滑动 ， 发 送 方便 可 以 
发 送 新 的 分 组 (分 别 是 分 组 4 和 分 组 5) 。 在 接收 方 ， 分 组 2 丢失 ， 因 此 分 组 3、4 和 5 被 
发 现 是 失 序 分 组 并 被 丢弃 。 

发 送 方 接收 方 


: 接收 分 组 0 


发 送 分 组 1 : ; 发 送 ACK 0 


3 接收 分 组 1 


一 发 送 分 组 2 : > 发 送 ACK 1 


发 送 分 组 3 : 
CHR): . 
` 接收 分 组 3， 丢 弃 
: 发 送 ACK | 


接收 ACK0 : 
发 送 分 组 4 : 
接收 ACK 1 : 
发 送 分 组 5 ; : 接收 分 组 4， 丢弃 
ee > 发送 ACK 1 
2 超时 - 
发 送 分 组 2 : 
发 送 分 组 3 。 
发 送 分 组 4 、 
发 送 分 组 5 ; 


: 接收 分 组 5， 丢 弃 
: 发 送 ACK 1 


: 接收 分 组 2， 交 付 
: 发 送 ACK 2 
: 接收 分 组 3， 交 付 
:发送 ACK 3 





图 3-22 运行 中 的 CBN 


在 结束 对 CBN 的 讨论 之 前 ,需要 提请 注意 的 是 ， 在 协议 栈 中 实现 该 协议 可 能 与 图 3-20 
中 的 扩展 FSM 有 相似 的 结构 。 该 实现 也 可 能 是 以 各 种 过 程 形式 出 现 ， 每 个 过 程 实现 了 在 响应 
各 种 可 能 出 现 的 事件 时 要 采取 的 动作 。 在 这 种 基于 事件 的 编程 (event-based programming) 
方式 中 ， 这 些 过 程 要 么 被 协议 栈 中 的 其 他 过 程 调用 ， 要么 作为 一 次 中 断 的 结果 。 在 发 送 
方 ， 这 些 事件 包括 : 来 自 上 层 实体 的 调用 去 调用 rdt_send(); @ 定 时 器 中 断 ; (3) 报 文 到 
达 时 ， 来 目下 层 的 调用 去 调用 rdt_rcv() 。 本 章 后 面 的 编程 作业 会 使 你 有 机 会 在 一 个 模拟 而 
真实 的 网 络 环境 中 实际 实现 这 些 例 程 。 
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这 里 我 们 注意 到 ，GBN 协议 中 综合 了 我 们 将 在 3.5 PA TCP 可 靠 数 据 传 输 构件 
时 遇 到 的 所 有 技术 。 这 些 技术 包括 使 用 序号 、 累 积 确 认 、 检 验 和 以 及 超时 / 重 传 操作 。 


3.4.4 选择 重 传 


在 图 3-17 中 ，GBN 协议 潜在 地 允许 发 送 方 用 多 个 分 组 “填充 流水 线 "， 因 此 避免 了 个 
等 协议 中 所 提 到 的 信道 利用 率 问 题 。 然 而 ，GBN 本 身 也 有 一 些 情况 存在 着 性 能 问题 。 尤 其 
是 当 窗 口 长 度 和 带宽 时 延 积 都 很 大 时 ， 在 流水 线 中 会 有 很 多 分 组 更 是 如 此 。 单 个 分 组 的 差 
错 就 能 够 引起 CBN 重 传 大 量 分 组 ， 许 多 分 组 根本 没有 必要 重 传 。 随 着 信道 差错 率 的 增加 ， 
流水 线 可 能 会 被 这 些 不 必要 重 传 的 分 组 所 充斥 。 想 象 一 下 ， 在 我 们 口述 消息 的 例子 中 ， 如 
果 每 次 有 一 个 单词 含糊 不 清 ， 其 前 后 1000 个 单词 (例如 ， 窗 口 长 度 为 1000 个 单词 ) 不 得 
不 被 重 传 的 情况 。 此 次 口述 会 由 于 这 些 反 复述 说 的 单词 而 变 慢 。 

顾名思义 ， 选 择 重 传 (SR) 协议 通过 让 发 送 方 仅 重 传 那些 它 怀 疑 在 接收 方 出 错 ( 即 
丢失 或 受 损 ) 的 分 组 而 避免 了 不 必要 的 重 传 。 这 种 个 别 的 、 按 需 的 重 传 要 求 接收 方 逐 个 地 
确认 正确 接收 的 分 组 。 再 次 用 窗口 长 度 来 限制 流水 线 中 未 完成 、 未 被 确认 的 分 组 数 。 然 
而 ， 与 CBN 不 同 的 是 ， 发 送 方 已 经 收 到 了 对 窗口 中 某 些 分 组 的 ACK. [A] 3-23 显示 了 SR 
发 送 方 看 到 的 序号 空间 。 图 3-24 详细 描述 了 SR 发 送 方 所 采取 的 动作 。 


send base nextseqnum 


图 例 : 
f eam | 发送 


， 还 未 中 Fa 











! 窗口 长 度 N 确认 
a) 发 送 方 看 到 的 序号 








rcv base \ 图 例 : 

- 失 序 Sed 可 接受 

ALU 但 未 被 确认 ” 国 ( 窗 口内 ) 
窗口 长 度 N i | 不 可 用 


b) 接收 方 看 到 的 序号 
图 3-23 选择 重 传 (SR) 发 送 方 与 接收 方 的 序号 空间 





1. 从 上 层 收 到 数据 。 当 从 上 层 接收 到 数据 后 ，SR 发 送 方 检查 下 一 个 可 用 于 该 分 组 的 序号 。 如 末 序 号 位 于 发 送 方 
的 窗口 内 ， 则 将 数据 打包 并 发 送 ; 否则 就 像 在 CBN 中 一 样 ， 要 么 将 数据 缓存 ， 要 么 将 其 返回 给 上 层 以 便 以 后 传输 。 

2. 超时 。 定时 需 再 次 被 用 来 防止 丢失 分 组 。 然而， 现在 每 个 分 组 必须 拥有 其 自己 的 逻辑 定时 右 ， 因 为 超时 发 
生 后 只 能 发 送 一 个 分 组 。 可 以 使 用 单个 硬件 定时 融 模 拟 多 个 逻辑 定时 右 的 操作 [Varghese 1997 ] 。 

3. 收 到 ACK。 如 果 收 到 ACK， 倘 若 该 分 组 序号 在 窗口 内 ， 则 SR 发 送 方 将 那个 被 确认 的 分 组 标记 为 已 接收 。 
如 果 该 分 组 的 序号 等 于 send_base， 则 窗口 基 序 号 回 前 移动 到 具有 最 小 序号 的 未 确认 分 组 处 。 如 果 窗 口 移 动 了 并 且 
有 序号 落 在 窗口 内 的 未 发 送 分 组 ， 则 发 送 这 些 分 组 











图 3-24 SR 发 送 方 的 事件 与 动作 
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SR PEW TT AG AAA — PTE RE MSO SP ZED TTT AS PL ek FE PY oP EPS EF E 
所 有 丢失 分 组 〈 即 序号 更 小 的 分 组 ) 肾 被 收 到 为 止 ， 这 时 才 可 以 将 一 批 分 组 按 序 交 付 给 上 
层 。 图 3-25 详细 列 出 了 SR 接收 方 所 采用 的 各 种 动作 。 图 3-26 给 出 了 一 个 例子 以 说 明 出 
现 丢 包 时 SR 的 操作 。 值 得 注意 的 是 ， 在 图 3-26 中 接收 方 初始 时 缓存 了 分 组 3、4、5,， 并 
在 最 终 收 到 分 组 2 时 ， 才 将 它们 一 并 交付 给 上 层 。 





l. 序号 在 [| rev_base, rev_base+N-1] 内 的 分 组 被 正确 接收 。 在 此 情况 下 ， 收 到 的 分 组 落 在 接收 方 的 窗口 
内 ， 一 个 选择 ACK 被 回 送 给 发 送 方 。 如 果 该 分 组 以 前 没收 到 过 ， 则 缓存 该 分 组 。 如果 该 分 组 的 序号 等 于 接收 窗口 
的 基 序 号 (图 3-23 中 的 rev_base)， 则 该 分 组 以 及 以 前 缓存 的 序号 连续 的 (起 始 于 rev_base 的 ) 分 组 交付 给 上 层 
然后 ， 接 收 窗口 按 向 前 移动 分 组 的 编号 向 上 交付 这 些 分 组 。 举 例子 来 说 ， 考 虑 一 下 图 3-26.， 当 收 到 一 个 序号 为 
rev_base =2 的 分 组 时 ， 该 分 组 及 分 组 3、4、5 可 被 交付 给 上 层 。 

2. 序号 在 [rev_base -N, rev_base-1] 内 的 分 组 被 正确 收 到 ， 在 此 情况 下 ， 必 须 产 生 一 个 ACK， 即 使 该 分 组 
是 接收 方 以 前 已 确认 过 的 分 组 。 

3. 其 他 情况 。 忽略 该 分 组 。 











图 3-25 SR 接收 方 的 事件 与 动作 


RET 接收 方 
分 组 0 发 送 l 
0123456789 We 
分 组 1 发 送 : 分 组 0 收 到 ， 交 付 ，ACK 0 发 送 
o123456789 : 20223456789 
_ 分 组 2 发 送 ; 分 组 1 收 到 ， 交 付 ，ACK 1 发 送 
分 组 2 发 送 Reis 


6123456727289 [01934567489 


(FA ) 
分 组 3 发 送 ， 窗 口 满 
0123456789 


: 分 组 3 收 到 ， 缓 存 ，ACK 3 发 送 
ACK 0 收 到 ， 分 组 4 发 送 o; 70123486789 
0123456789 。 


ACK 1 收 到 ， 分 组 5 发 送 
0123456789 


: 分 组 4 收 到 ， 缓 存 ，ACK 4 发 送 
:0123456789 


: 分 组 5 收 到 ， 缓 存 ，ACK 5 发 送 
分 组 2 超时 ， 重 传 分 组 2 o); : 0143456789 
0123456789 ; : 


: 分 组 2 收 到 ， 分 组 2、3、4、5 交 付 ， 
ACK 2 发 送 
0123456789 


ACK 3 收 到 ， 无 分 组 可 发 
0123456789 


图 3-26 SR 操作 
注意 到 图 3-25 中 的 第 二 步 很 重要 ， 接 收 方 重新 确认 (而 不 是 忽略 ) 已 收 到 过 的 那些 
序号 小 于 当前 窗口 基 序号 的 分 组 。 你 应 该 理解 这 种 重新 确认 确实 是 需要 的 。 例 如 ， 给 定 在 
图 3-23 中 所 示 的 发 送 方 和 接收 方 的 序号 空间 ， 如 果 分 组 send_base 的 ACK 没有 从 接收 方 传 
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播 回 发 送 方 ， 则 发 送 方 最 终 将 重 传 分 组 send_base， 即 使 显然 ( 对 我 们 而 不 是 对 发 送 方 来 
说 1) 接收 方 已 经 收 到 了 该 分 组 。 如 果 接 收 方 不 确认 该 分 组 ， 则 发 送 方 窗口 将 永远 不 能 回 
前 滑动 ! 这 个 例子 说 明了 SR 协议 〈 和 很 多 其 他 协议 一 样 ) 的 一 个 重要 方面 。 对 于 哪些 分 
组 已 经 被 正确 接收 ， 哪些 没有 ， 发 送 方 和 接收 方 并 不 总 是 能 看 到 相同 的 结 来 。 对 SR 协议 
而 言 ， 这 就 意味 着 发 送 方 和 接收 方 的 窗口 并 不 总 是 一 致 。 

当 我 们 面 对 有 限 序号 范围 的 现实 时 ,发送 方 和 接收 方 窗口 上 缺乏 同步 会 产生 严重 的 后 
果 。 考 虑 下 面 例子 中 可 能 发 生 的 情况 ， 该 例 有 包括 4 个 分 组 序号 0、1、2、3 的 有 限 序号 
范围 上 且 窗 口 长 度 为 3。 假 定 发 送 了 分 组 0 至 2， 并 在 接收 方 被 正确 接收 且 确 认 了 。 此 时 ， 
接收 方 窗口 落 在 第 4、5、6 个 分 组 上 ， 其 序号 分 别 为 3、0、1, 现在 考虑 两 种 情况 。 在 第 
一 种 情况 下 ， 如 图 3-27a 所 示 ， 对 前 3 个 分 组 的 ACK 丢失 ， 因 此 发 送 方 重 传 这 些 分 组 。 因 
此 ， 接 收 方 下 一 步 要 接收 序号 为 0 的 分 组 ， 即 第 一 个 发 送 分 组 的 副本 .。 


发 送 方 窗口 接收 方 窗口 
(接收 后 ) ka (接收 后 ) 
é #30 12 m 
ACKO 0123012 
012306012 
` ACK1 0123012 
06123012 
' ACK2 0123022 
超时 ， 重 传 
分 组 0 





0123012 a 接收 具有 序号 0 的 分 组 


a) 


发 送 方 窗口 接收 方 窗口 
(接收 后 ) i (接收 后 ) 


3012 


-ACKO 02223012 
0123012 


ACKi 0123012 
O32 301 2 
ACK2 0123012 
0123012 


012:3°@ 1 2 





.接收 具有 序号 0 的 分 组 


b) 


图 3-27 SR 接收 方 窗口 太 大 的 困境 : 是 一 个 新 分 组 还 是 一 次 重 传 
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在 第 二 种 情况 下 ， 如 图 3-27b 所 示 ， 对 前 3 个 分 组 的 ACK 都 被 正确 交付 。 因 此 发 送 方 
回 前 移动 窗口 并 发 送 第 4、5、6 个 分 组 ， 其 序号 分 别 为 3、0、1。 序 号 为 3 的 分 组 丢失 ， 
但 序号 为 0 的 分 组 到 达 (一 个 包含 新 数据 的 分 组 ) 。 

现在 考虑 一 下 图 3-27 中 接收 方 的 观点 ， 在 发 送 方 和 接收 方 之 间 有 一 副 假想 的 帘子 ， 
因为 接收 方 不 能 “看 见 ” 发 送 方 采取 的 动作 。 接 收 方 所 能 观察 到 的 是 它 从 信道 中 收 到 的 以 
及 它 癌 信道 中 发 出 报 文 序列 。 就 其 所 关注 的 而 言 ， 图 3-27 中 的 两 种 情况 是 等 同 的 。 没 有 
办 法 区 分 是 第 一 个 分 组 的 重 传 还 是 第 5 个 分 组 的 初次 传输 。 显 然 ， 窗 口 长 度 比 序号 空间 小 
1 时 协议 无 法 工作 。 但 窗口 必须 多 小 呢 ? 本 章 后 面 的 一 道 习 题 请 你 说 明 为 何 对 于 SR 协议 
而 言 ， 窗 口 长 度 比 须 小 于 或 等 于 序号 空间 大 小 的 一 半 。 

在 本 书 配套 的 网 站 上 ， HITT E OR USC TT ST faved a ee Eee EP aN 

前 对 CBN Java 小 程序 所 进行 的 相同 的 实验 。 这 些 结果 与 你 期 望 的 一 致 四 ? 

至 此 我 们 结束 了 对 可 靠 数据 传输 协议 的 讨论 .我 们 已 涵盖 许多 基础 知识 ， 并 介绍 了 多 
种 机 制 ， 这 些 机 制 可 一 起 提供 可 靠 数据 传输 。 表 3-1 总 结 这 些 机 制 。 既 然 我 们 已 经 学 习 了 
所 有 这 些 运 行 中 的 机 制 ， 并 能 看 到 “全 景 ”， 我 们 建议 你 再 复习 一 遍 本 节 内 容 ， 看 看 这 些 
机 制 是 怎样 逐步 被 添加 进来 ， 以 涵盖 复杂 性 渐 增 的 〈 现 实 的 ) 连接 发 送 方 与 接收 方 的 各 种 
信道 模型 的 ， 或 者 如 何 改善 协议 性 能 的 ， 


表 3-1 可 靠 数 据 传输 机 制 及 其 用 途 的 总 结 


机 制 用 途 和 说 阴 
检验 和 用 于 检测 在 一 个 传输 分 组 中 的 比特 错误 
rE AY at 用 于 超时 / 重 传 一 个 分 组 ， 可 能 因为 该 分 组 (或 其 ACK) 在 信道 中 丢失 了 。 由 于 当 一 个 分 组 延 


时 但 未 丢失 (过 早 超时 )， 或 当 一 个 分 组 已 被 接收 方 收 到 但 从 接收 方 到 发 送 方 的 ACK EKHI, aj 
能 产生 超时 事件 ， 所 以 接收 方 可 能 会 收 到 一 个 分 组 的 多 个 元 余 副 本 


序号 用 于 为 从 发 送 方 流 回 接收 方 的 数据 分 组 按 顺 序 编号 。 所 接收 分 组 的 序号 问 的 空隙 可 使 接收 方 检 
测 出 丢失 的 分 组 。 有 具有 相同 序号 的 分 组 可 使 接收 方 检测 出 一 个 分 组 的 宛 余 副 本 

确认 接收 方 用 于 告诉 发 送 方 一 个 分 组 或 一 组 分 组 已 被 正确 地 接收 到 了 -: 确认 报 文通 常 携带 着 被 确认 
的 分 组 或 多 个 分 组 的 序号 。 确 认可 以 是 逐个 的 或 累积 的 ， 这 取决 于 协议 

否定 确认 接收 方 用 于 告诉 发 送 方 某 个 分 组 未 被 正确 地 接收 否定 确认 报 文通 常 携带 着 未 被 正确 接收 的 分 


组 的 序号 

窗口 、 流 水 线 发 送 方 也 许 被 限制 仅 发 送 那些 序号 落 在 一 个 指定 范围 内 的 分 组 - 通过 允许 一 次 发 送 多 个 分 组 但 
未 被 确认 ， 发 送 方 的 利用 率 可 在 停 等 操作 模式 的 基础 上 得 到 增加 。 我 们 很 快 将 会 看 到 ， 窗 口 长 度 
可 根据 接收 方 接收 和 缓存 报 文 的 能 力 、 网 络 中 的 拥塞 程度 或 两 者 情况 来 进行 设置 


我 们 通过 考虑 在 底层 信道 模型 中 的 一 个 遗留 假设 来 结束 对 可 靠 数 据 传输 协议 的 讨论 。 
BERL, SUSE MEERA SR 2 MON RRMA THE. 这 在 发 送 方 
与 接收 方 由 单 段 物理 线路 相连 的 情况 下 ， 通 常 是 一 个 合理 的 假设 。 然 而 ， 当 连接 两 端的 
“信道 ”是 一 个 网 络 时 ， 分 组 重新 排序 是 可 能 会 发 生 的 。 分 组 重新 排序 的 一 个 表现 就 是 ， 
一 个 具有 序号 或 确认 号 x 的 分 组 的 旧 副 本 可 能 会 出 现 ， 即 使 发 送 方 或 接收 方 的 窗口 中 都 设 
有 包含 x。 对 于 分 组 重新 排序 ， 信 道 可 被 看 成 基本 上 是 在 缓存 分 组 ， 并 在 将 来 任意 时 刻 自 
伏地 释放 出 这 些 分 组 。 由 于 序号 可 以 被 重新 使 用 ， 那 么 必须 小 心 ， 以 免 出 现 这 样 的 元 余 分 
组 。 实 际 应 用 中 采用 的 方法 是 ,确保 一 个 序号 不 被 重新 使 用 ， 直 到 发 送 方 “确信 ”任何 先 
前 发 送 的 序号 为 * 的 分 组 都 不 再 在 网 络 中 为 止 。 通 过 假定 一 个 分 组 在 网 络 中 的 “存活 ”时 
间 不 会 超过 某 个 固定 最 大 时 间 量 来 做 到 这 一 点 。 在 高 速 网 络 的 TCP 扩展 中 ， 最 长 的 分 组 寿 
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命 被 假定 为 大 约 3 分 钟 [RFC 1323]. | Sunshine 1978] 描述 了 一 种 使 用 序号 的 方法 ， 它 可 
使 重新 排序 问题 完全 避免 。 


3.5 面向 连接 的 运输 : TCP 


既然 我 们 已 经 学 习 了 可 靠 数据 传输 的 基本 原理 ， 我 们 就 可 以 转 而 学 习 TCP 了 。TCP 是 
因特网 运输 层 的 面向 连接 的 可 靠 的 运输 协议 。 我 们 在 本 节 中 将 看 到 ， 为 了 提供 可 靠 数 据 伟 
输 ，TCP 依赖 于 前 一 节 所 讨论 的 许多 基本 原理 ， 其 中 包括 差错 检测 、 重 传 、 累 积 确认 、 定 
时 器 以 及 用 于 序号 和 确认 号 的 首部 字段 。TCP 定义 在 RFC 793, RFC 1122, RFC 1323, 
RFC 2018 以 及 RFC 2581 H}. 


3.5.1 TCP 


TCP 被 称 为 是 面向 连接 的 ( connection- oriented ) ， 这 是 因为 在 一 个 应 用 进程 可 以 开始 
回 另 一 个 应 用 进程 发 送 数 据 之 前 ， 这 两 个 进程 必须 先 相 互 “握手 ”， 即 它们 必须 相互 发 送 
某 些 预备 报 文 段 ， 以 建立 确保 数据 传输 的 参数 。 作 为 TCP 连接 建立 的 一 部 分 ， 连 接 的 双方 
者 将 初始 化 与 TCP 连接 相关 的 许多 TCP 状态 变量 (其 中 的 许多 状态 变量 将 在 本 节 和 3.7 
节 中 讨论 ) 。 


Vinton Cerf 和 Robert Kahn 与 TCP/IP 


在 20 世纪 70 年 代 早 期 ， 分 组 交换 网 开始 飞速 增长 ， 而 因特网 的 前 身 ARPAnet 也 只 
是 当时 众多 分 组 交换 网 中 的 一 个 。 这 些 网 络 都 有 它们 各 自 的 协议 。Vinton Cerf 和 Robert 
Kahn 这 两 个 研究 人 员 认 识 到 互联 这 此 网络 的 重要 性 ， 发 明了 沟通 网 络 的 TCP/IP 协议 ， 
该 协议 代表 传输 控制 协议 /网 际 协 议 (Transmission Control Protocol/Internet Protocol), $% 
然 Cerf 和 Kahn 开始 时 把 该 协议 看 成 是 单一 的 实体 ， 但 是 后 来 将 它 分 成 单独 运行 的 两 个 
部 分 : TCP #e IP, Cerf 和 Kahn Æ 1974 年 5 月 的 《IEEE Transactions on Communications 
Technology) 杂志 上 发 表 了 一 篇 关于 TCP/IP 的 论文 ， 

TCP/IP 协议 是 当今 因特网 的 支柱 性 协议 ， 但 它 的 发 明 先 于 PC、 工作 站 、 智 能 手机 
和 平板 电脑 ， 先 于 以 太 网 、DSL、WiFi 和 其 他 接 入 网 技术 的 激增 ， 先 于 Web、 社 交 媒 体 
和 流 式 视频 等 。Cerf 和 Kahn 看 到 了 对 于 联网 协议 的 需求 ， 一 方面 为 行将 定义 的 应 用 提 
供 广 泛 的 支持 ， 另 一 方面 允许 任何 主机 与 链 路 层 协 议 互 操作 。 

2004 F, Cerf 和 Kahn 由 于 “联网 方面 的 开创 性 工作 (包括 因特网 的 基本 通信 协议 
TCP/IP 的 设计 和 实现 ) 以 及 联网 方面 富有 才能 的 领导 ”而 获得 ACM 图 灵 奖 ， 该 奖项 被 
认为 是 “计算 机 界 的 诺 贝尔 奖 ”-。 


这 种 TCP“ 连 接 ” 不 是 一 条 像 在 电路 交换 网 络 中 的 端 到 端 TDM 或 FDM 电路 ， 也 不 是 
一 条 虚 电 路 〈 参 见 第 1 草 ) ， 因 为 其 连接 状态 完全 保留 在 两 个 端 系统 中 。 由 于 TCP 协议 只 
在 端 系统 中 运行 ， 而 不 在 中 间 的 网 络 元 素 (路 由 右 和 链 路 层 交 换 机 ) 中 运行 ， 所 以 中 间 的 
网 络 元 系 不 会 维持 TCP ERRES. PEE, PEH AX TCP 连接 完全 视而不见 ， 它 们 
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看 到 的 是 数据 报 ， 而 不 是 连接 。 

TCP 连接 提供 的 是 全 双 工 服务 (full-duplex service): 如 果 一 人 台 主 机 上 的 进程 A 与 为 一 
台 主 机 上 的 进程 B 存在 一 条 TCP 连接 ， 那么 应 用 层 数据 就 可 在 从 进程 B 流向 进程 A 的 同 
时 ， 也 从 进程 A intel di fe B, TCP 连接 也 总 是 点 对 点 (point-to-point) 的 ， 即 在 单个 发 送 
方 与 单个 接收 方 之 间 的 连接 。 所 谓 “ 多 播 ”( 参 见 4.7 节 )， 即 在 一 次 发 送 操作 中 ， 从 一 
个 发 送 方 将 数据 传送 给 多 个 接收 方 ， 对 TCP 来 说 这 是 不 可 能 的 。 对 于 TCP ha, MSE 
机 是 一 对 ， 而 3 台 主 机 则 太 多 ! 

我 们 现在 来 看 看 TCP 连接 是 怎样 建立 的 。 假 设 运行 在 某 台 主机 上 的 一 个 进程 想 与 另 一 
台 主 机 上 的 一 个 进程 建立 一 条 连接 。 前 面 讲 过 ， 发 起 连接 的 这 个 进程 被 称 为 客户 进程 ， 而 
态 一 个 进程 被 称 为 服务 器 进程 。 该 客户 应 用 进程 首先 要 通知 客户 运输 层 ， 它 想 与 服务 做 上 
的 一 个 进程 建立 一 条 连接 。2. 7. 2 节 讲 过 ， 一 个 Python 客户 程序 通过 发 出 下 面 的 命令 来 实 
现 此 目的 。 

clientSocket.connect((serverName,serverPort ) ) 

其 中 serverName 是 服务 器 的 名 字 ，serverPort 标识 了 服务 器 上 的 进程 。 客 户 上 的 TCP 
便 开 始 与 服务 右上 的 TCP 建立 一 条 TCP 连接 。 我 们 将 在 本 节 后 面 更 为 详细 地 讨论 连接 建 
立 的 过 程 。 现 在 知道 下 列 事实 就 可 以 了 : 客户 首先 发 送 一 个 特殊 的 TCP 报 文 段 ， 服 务 器 用 
另 一 个 特殊 的 TCP 报 文 段 来 响应 ， 最 后 ， 客 户 再 用 第 三 个 特殊 报 文 段 作为 响应 。 前 两 个 报 
文 段 不 可 载 “ 有 效 载 何 ”， 也 就 是 不 包含 应 用 层 数据 ; 而 第 三 个 报 文 段 可 以 承载 有 效 载 何 。 
由 于 在 这 两 台 主 机 之 间 发 送 了 3 个 报 文 段 ， 所 以 这 种 连接 建立 过 程 常 被 称 为 三 次 握手 
( three-way handshake ) . 

一 旦 建立 起 一 条 TCP 连接 ， 两 个 应 用 进程 之 间 就 可 以 相互 发 送 数 据 了 。 我 们 考虑 一 下 
从 客户 进程 回 服务 融 进 程 发 送 数据 的 情况 。 如 2.7 节 中 所 述 ， 客 户 进程 通过 套 接 字 (该 进 
程 之 门 ) 传递 数据 流 。 数 据 一 旦 通过 该 门 ， 它 就 由 客户 中 运行 的 TCP 控制 了 。 如 图 3-28 
所 示 ，TCP 将 这 些 数据 引导 到 该 连接 的 发 送 缓存 (send buffer) 里 ， 发 送 缓存 是 在 三 次 握 
手 初 期 设置 的 缓存 之 一 。 接 下 来 TCP 就 会 不 时 从 发 送 缓存 里 取出 一 块 数据 。 有 趣 的 是 ， 在 
TCP 规范 [RFC 793] 中 却 没 提 及 TCP 应 何 时 实际 发 送 缓存 里 的 数据 ， 只 是 描述 为 “TCP 
应 该 在 它 方 便 的 时 候 以 报 文 段 的 形式 发 送 数据 " 。TCP 可 从 缓存 中 取出 并 放 和 人 报 文 段 中 的 数 
据 数 量 受 限于 最 大 报 文 段 长 度 (Maximum Segment Size, MSS), MSS 通常 根据 最 初 确定 的 由 
本 地 发 送 主机 发 送 的 最 大 链 路 层 帧 长 度 ( 即 所 谓 的 最 大 传输 单元 (Maximum Transmission 
Unit, MTU)) 来 设置 。 设 置 该 MSS 要 保证 一 个 TCP 报 文 段 ( 当 封 法 在 一 个 IP 数据 报 中 ) 
加 上 TCP/IP 首部 长 度 (通常 40 字 节 ) 将 适合 单个 链 路 层 帧 。 以 太 网 和 PPP 链 路 层 协议 
部 具有 1500 ZAJ MTU, Aue MSS 的 典型 值 为 1460 字 节 。 已 经 提出 了 多 种 发 现 路 径 
MTU 的 方法 ， 并 基于 路 径 MTU 值 设置 MSS ( 路径 MTU 是 指 能 在 从 源 到 目的 地 的 所 有 链 路 
上 发 送 的 最 大 链 路 层 帧 [RFC 1191] ) 。 注 意 到 MSS 是 指 在 报 文 段 里 应 用 层 数据 的 最 大 长 
度 ， 而 不 是 指 包 括 TCP 首部 的 TCP 报 文 段 的 最 大 长 度 。( 该 术语 很 容易 混淆 ， 但 是 我 们 不 
GAKHE, AACE CARA HET.) 

TCP 为 每 块 客户 数据 配 上 一 个 TCP 首部 ， 从 而 形成 多 个 TCP 报 文 段 (TCP segment) 。 
这 些 报 文 段 被 下 传 给 网 络 层 ， 网 络 层 将 其 分 别 封 装 在 网 络 层 IP 数据 报 中 。 然 后 这 些 IP 数 
据 报 被 发 送 到 网 络 中 。 当 TCP 在 男 一 端 接 收 到 一 个 报 文 段 后 ， 该 报 文 段 的 数据 就 被 放 人 该 
TCP 连接 的 接收 缓存 中 ， 如 图 3-28 中 所 示 。 应 用 程序 从 此 缓存 中 读 取 数据 流 。TCP 连接 的 
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每 一 端 都 有 各 目的 发 送 缓 在 和 接收 缓存 。( 读 者 可 以 参见 http://www. awl. com/kurose- ross 处 
的 在 线 流 控制 Java 小 程序 ， 它 提供 了 关于 发 送 缓存 和 接收 缓存 的 一 个 动画 演示 。) 


进程 读 取 数 据 





图 3-28 TCP 发 送 缓存 和 接收 缓存 


从 以 上 讨论 中 我 们 可 以 看 出 ，TCP 连接 的 组 成 包括 : 一 台 主 机 上 的 缓存 、 变 量 和 与 进 
程 连接 的 套 接 字 ， 以 及 男 一 台 主 机 上 的 男 一 组 缓存 、 变 量 和 与 进程 连接 的 套 接 字 。 如 前 面 
讲 过 的 那样 ， 在 这 两 台 主 机 之 间 的 网 络 元 素 〈 路 由 需 、 交 换 机 和 中 继 需 ) 中 ， 没 有 为 该 连 
接 分 配 任何 缓存 和 变量 。 


3.5.2 TCP 报 文 段 结构 


简要 地 了 解 了 TCP 连接 后 ， 我 们 研究 一 下 TCP 报 文 段 结构 。TCP 报 文 段 由 首部 字段 
和 一 个 数据 字段 组 成 。 数 据 字段 包含 一 块 应 用 数据 。 如 前 所 述 ，MSS 限制 了 报 文 段 数据 字 
段 的 最 大 长 度 。 当 TCP 发 送 一 个 大 文件 ， 例 如 某 Web 页 面 上 的 一 个 图 像 时 ，TCP 通常 是 
将 该 文件 划分 成 长 度 为 MSS 的 若干 块 (最 32 比 特 
后 一 块 除外 ， 它 通常 小 于 MSS), Rm, NS 
互 式 应 用 通常 传送 长 度 小 于 MSS 的 数据 块 。 ，” “”“” 源 六 3 
例如 ， 对 于 像 Telnet 这 样 的 远程 登录 应 用 ， 
其 TCP 报 文 段 的 数据 字段 经 常 只 有 一 个 字 
P HF TCP 的 首部 一 般 是 20 字 节 ( 比 ae 
UDP 首部 多 12 字 节 ) ， 所 以 Telnet 发 送 的 报 | 
文 段 也 许 只 有 21 FAK. 

图 3-29 显示 了 TCP 报 文 段 的 结构 。 与 
UDP 一 样 ， 首 部 包括 源 端 口号 和 目的 端口 
号 ， 它 被 用 于 多 路 复 用 /分 解 来 目 或 送 到 上 
层 应 用 的 数据 。 另 外 ， 同 UDP 一 样 ，TCP 
首部 也 包括 检验 和 字段 (checksum field ) 。 — 

TCP 报 文 段 首部 还 包含 下 列 字段 : 图 3-29 TCP 报 文 段 结构 
e 32 比特 的 序号 字段 (sequence number field) 和 32 比特 的 确认 号 字段 (acknowl- 
edgment number field) 。 这 些 字 段 被 TCP 发 送 方 和 接收 方 用 来 实现 可 靠 数 据 传输 服 
务 ， 讨 论 见 后 。 
。 16 比特 的 接收 窗口 字段 (receive window field ) ， 该 字段 用 于 流量 控制 。 我 们 很 快 
就 会 看 到 ， 该 字段 用 于 指示 接收 方 愿意 接受 的 字 节 数量 。 
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o 4 比特 的 首部 长 度 字 段 (header length field ) ， 该 字段 指示 了 以 32 比特 的 字 为 单位 
AY TCP 首部 长 度 。 由 于 TCP 选项 字段 的 原因 ，TCP 首部 的 长 度 是 可 变 的 。( 通 常 ， 
选项 字段 为 空 ， 所 以 TCP 首部 的 典型 长 度 就 是 20 字 节 。 ) 
e 可 选 与 变 长 的 选项 字段 (options field) ， 该 字段 用 于 发 送 方 与 接收 方 协商 最 大 报 文 
BRKE (MSS) 时 ， 或 在 高 速 网 络 环境 下 用 作 窗 口 调节 因子 时 使 用 。 首 部 字段 中 
还 定义 了 一 个 时 间 鹤 选项 。 可 参见 RFC 854 和 RFC 1323 了 解 其 他 细节 . 
e 6 比特 的 标志 字段 (flag field), ACK 比特 用 于 指示 确认 字段 中 的 值 是 有 效 的 ， 即 
该 报 文 段 包括 一 个 对 已 被 成 功 接收 报 文 段 的 确认 。RST、SYN 和 FIN 比特 用 于 连 
接 建立 和 拆除 ， 我 们 将 在 本 节 后 面 讨论 该 问题 。 当 PSH 比特 被 设置 的 时 候 ， 就 指 
示 接 收 方 应 立即 将 数据 交 给 上 层 。 最 后 ，URG 比特 用 来 指示 报 文 段 里 存在 着 被 发 
送 端 的 上 层 实体 置 为 “紧急 ”的 数据 。 紧 急 数 据 的 最 后 一 个 字 节 由 16 比特 的 紧急 
数据 指针 字段 指出 。 当 紧急 数据 存在 并 给 出 指向 紧急 数据 尾 的 指针 的 时 候 ，TCP 
必须 通知 接收 问 的 上 层 实体 。 (在 实践 中 ，PSH 、URG 和 紧急 数据 指针 并 没有 使 
Ho 为 了 完整 性 起 匈 ， 我 们 才 提 到 这 些 字 有 段 .) 
1. 序号 和 确认 号 
TCP 报 文 段 首部 中 两 个 最 重要 的 字段 是 序号 字段 和 确认 号 字段 。 这 两 个 字段 是 TCP 可 
靠 传 输 服 务 的 关键 部 分 。 但 是 在 讨论 这 两 个 字段 是 如 何 用 于 提供 可 靠 数 据 传输 之 前 ， 我 们 
首先 来 解释 一 下 TCP 在 这 两 个 字段 中 究竟 放置 了 什么 。 
TCP 把 数据 看 成 一 个 无 结构 的 、 有 序 的 字 市 流 。 我 们 从 TCP 对 序号 的 使 用 上 可 以 看 出 
这 一 点 ， 因 为 序号 是 建立 在 传送 的 字 节 流 之 上 ， 而 不 是 建立 在 传送 的 报 文 段 的 序列 之 上 ， 
一 个 报 文 段 的 序号 (sequence number for a segment) 因此 是 该 报 文 段 首 字 节 的 字 节 流 编号 。 
举例 来 说 ， 假 设 主机 A 上 的 一 个 进程 想 通过 一 条 TCP 连接 向 主机 B 上 的 一 个 进程 发 送 一 
个 数据 流 。 主 机 A 中 的 TCP 将 隐 式 地 对 数据 流 中 的 每 一 个 字 节 编号 。 假 定数 据 流 由 一 个 
包含 500 000 字 节 的 文件 组 成 ， 其 MSS 为 1000 字 节 ， 数 据 流 的 首 字 节 编 号 是 0。 如 图 3-30 
所 示 ， 该 TCP 将 为 该 数据 流 构 建 500 个 报 文 段 。 给 第 一 个 报 文 段 分 配 序号 0， 第 二 个 报 文 
段 分 配 序号 1000， 第 三 个 报 文 段 分 配 序 号 2000， 以 此 类 推 。 每 一 个 序号 被 十 入 到 相应 TCP 
报 文 段 诈 部 的 序号 字段 中 。 


| 第 一 个 报 文 段 的 数据 第 二 个 报 文 段 的 数据 
Stay 


rate E E aa 3 
aay = 








图 3-30 ”文件 数据 划分 成 TCP FR OC EZ 


现在 我 们 考虑 一 下 确认 号 。 确 认 号 要 比 序号 难处 理 一 些 。 前 面 讲 过 ，TCP 是 全 双 工 
的 ， 因 此 主机 A 在 回 主机 B 发 送 数据 的 同时 ， 也 许 也 接收 来 自主 机 B 的 数据 (都 是 同一 
条 TCP 连接 的 一 部 分 ) 。 从 主机 B 到 达 的 每 个 报 文 段 中 都 有 一 个 序号 用 于 从 B 流向 A 的 数 
据 。 主 机 A 填充 进 报 文 段 的 确认 号 是 主机 A 期 望 从 主机 B 收 到 的 下 一 字 节 的 序号 。 看 一 
些 例子 有 助 于 理解 实际 发 生 的 事情 ,假设 主机 A 已 收 到 了 来 自主 机 B 的 编号 为 0 ~535 的 
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所 有 字 节 ， 同 时 假设 它 打算 发 送 一 个 报 文 段 给 主机 B。 主 机 A 等 待 主机 B MGE hE 
536 及 之 后 的 所 有 字 节 。 所 以 主机 A MAREE AE EARL B 的 报 文 段 的 确认 号 字段 中 十 
E536; 

再 举 一 个 例子 ， 假设 主机 A 已 收 到 一 个 来 自主 机 B 的 包含 字 节 0 ~535 的 报 文 段 ， 以 
及 男 一 个 包含 字 节 900 ~ 1000 的 报 文 段 。 由 于 某 种 原因 ， 主 机 A 还 没有 收 到 字 廊 536 ~ 899 
的 报 文 段 。 在 这 个 例子 中 ， 主 机 A 为 了 重新 构建 主机 B 的 数据 流 ， 仍 在 等 待 字 节 536 (和 
其 后 的 字 节 )。 因 此 ，A 到 B 的 下 一 个 报 文 段 将 在 确认 号 字段 中 包含 536。 因 为 TCP 只 确 
认 该 流 中 至 第 一 个 丢失 字 节 为 止 的 字 节 ， 所 以 TCP 被 称 为 提供 累积 确认 (cumulative 
acknowledgment ) 。 

最 后 一 个 例子 也 会 引发 一 个 重要 而 微妙 的 问题 。 主 机 A ENE PR CE CT 
536 ~899) 之 前 收 到 第 三 个 报 文 段 ( 字 节 900 ~ 1000)。 因 此 ， 第 三 个 报 文 段 失 序 到 达 。 
该 微妙 的 问题 是 : 当主 机 在 一 条 TCP 连接 中 收 到 失 序 报 文 段 时 该 怎么 办 ?有 趣 的 是 ，TCP 
REC 并 没有 为 此 明确 规定 任何 规则 ， 而 是 把 这 一 问题 留 给 实现 TCP 的 编程 人 员 去 处 理 。 他 
们 有 两 个 基本 的 选择 : 由 接收 方 立即 丢弃 失 序 报 文 段 (如 前 所 述 ， 这 可 以 简化 接收 方 的 设 
ih); 接 收 方 保留 失 序 的 字 市 ， 并 等 待 缺 少 的 字 节 以 填补 该 间 隅 。 显 然后 一 种 选择 对 
网 络 融 宽 而 言 更 为 有 有效， 是 实践 中 来 用 的 方法 

在 图 3-30 中 ， 我 们 假设 初始 序号 为 0。 事实 上 ， 一 条 TCP 连接 的 双方 均 可 随机 地 选择 
初始 序号 。 这 样 做 可 以 减少 将 那些 仍 在 网 络 中 存在 的 来 自 两 台 主 机 之 间 先 前 已 终止 的 连接 
的 报 文 段 ， 误 认为 是 后 来 这 两 台 主机 之 间 新 建 连接 有 所 产生 的 有 效 报 文 上 段 的 可 能 性 CE REII 
与 昌 连 接 使 用 了 相同 的 端口 号 ) [Sunshine 1978 | 。 

2. Telnet: 序号 和 确认 号 的 一 个 学 习 案例 

Telnet 由 RFC 854 定义 ， 它 现在 是 一 个 用 于 远程 登录 的 流行 应 用 层 协 议 。 它 运行 在 
TCP 之 上 ,被 设计 成 可 在 任意 一 对 主机 之 间 工 作 。Telnet 与 我 们 第 2 章 讨 论 的 批量 数据 传 
输 应 用 不 同 ， 它 是 一 个 交互 式 应 用 。 我 们 在 此 讨论 一 个 Telnet 例子 ， 因 为 该 例子 很 好 地 并 
述 TCP 的 序号 与 确认 号 。 我 们 注意 到 许多 用 户 现在 更 愿意 采用 SSH 协议 而 不 是 Telnet, [Al 
为 在 Telnet 连接 中 发 送 的 数据 (包括 口令 !) 是 没有 加 密 的 ， 使 得 Telnet 易于 受到 家 听 攻 
击 ( 如 在 8.7 节 中 讨论 的 那样 ) 。 

假设 主机 A 发 起 一 个 与 主机 B 的 Telnet 会 话 。 因 为 是 主机 A 发 起 该 会 话 ， 因 此 它 被 
标记 为 客户 ， 而 主机 B 被 标记 为 服务 器 。( 在 客户 端的 ) 用 户 键 入 的 每 个 字符 部 会 被 发 送 
至 远程 主机 ; 远程 主机 将 回 送 每 个 字符 的 副本 给 客户 ， 并 将 这 些 字 符 显 示 在 Telnet 用 户 的 
屏幕 上 。 这 种 “ 回 显 ”(echo back) 用 于 确保 由 Telnet 用 户 发 送 的 字符 已 经 锌 远程 主机 收 
到 并 在 远程 站 点 上 得 到 处 理 。 因 此 ， 在 从 用 户 击 键 到 字符 被 显示 在 用 户 屏幕 上 这 段 时 间 
内 ， 每 个 字符 在 网 络 中 传输 了 两 次 ， 

现在 假设 用 户 输入 了 一 个 字符 “C” ， 然 后 喝 起 了 咖啡 。 我 们 考察 一 下 在 客户 与 服务 
需 之 间 发 送 的 TCP 报 文 段 。 如 图 3-31 所 示 ， 假 设 客户 和 服务 需 的 起 始 序号 分 别 是 42 和 
79。 前 面 讲 过 ， 一 个 报 文 段 的 序号 就 是 该 报 文 段 数 据 字 段 首 字 节 的 序号 。 因 此 ， 客 户 发 送 
的 第 一 个 报 文 段 的 序号 为 全 ， 服 务 器 发 送 的 第 一 个 报 文 段 的 序号 为 7 9。 前 面 讲 过 ， 确 认 
号 就 是 主机 正在 等 待 的 数据 的 下 一 个 字 节 序号 。 在 TCP 连接 建立 后 但 没有 发 送 任何 数据 之 
前 ， 该 客户 等 待 字 节 79, MARS ARSE RSET 42, 
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图 3-31 一 个 经 TCP 的 简单 Telnet 应 用 的 确认 号 和 序号 


如 图 3-31 中 所 示 ， 共 发 送 3 个 报 文 段 。 第 一 个 报 文 段 是 由 客户 发 往 服务 器 ， 在 它 的 
数据 字段 里 包含 一 字 节 的 字符 “C” 的 ASCH 码 。 如 我 们 刚 讲 到 的 那样 ， 第 一 个 报 文 段 的 
子叶 字段 里 是 42。 另 外 ， 由 于 客户 还 没有 接收 到 来 自 服务 器 的 任何 数据 ， 因 此 该 第 一 个 报 
文 段 中 的 确认 号 字段 中 是 79， 

第 二 个 报 文 段 是 由 服务 器 发 往 客 户 。 它 有 两 个 目的 : 首先 它 是 为 该 服务 需 所 收 到 数据 
提供 一 个 确认 。 通 过 在 确认 号 字段 中 填 人 43 ， 服 务 器 告诉 客户 它 已 经 成 功 地 收 到 字 节 42 
及 以 前 的 所 有 字 节 ， 现 在 正 等 待 着 字 节 43 的 出 现 。 该 报 文 段 的 第 二 个 目的 是 回 显 字 符 
“CC 。 因 此 ， 在 第 二 个 报 文 段 的 数据 字段 里 填 人 的 是 字符 “C ”的 ASCI 码 。 第 二 个 报 文 
段 的 序号 为 79， 它 是 该 TCP 连接 上 从 服务 器 到 客户 的 数据 流 的 起 始 序号 ， 这 也 正 是 服务 
需要 发 送 的 第 一 个 字 节 的 数据 。 值 得 注意 的 是 ， 对 客户 到 服务 器 的 数据 的 确认 被 装载 在 一 
个 承载 服务 器 到 客户 的 数据 的 报 文 段 中 ; 这 种 确认 被 称 为 是 被 朱 带 (piggybacked) 在 服务 
给 到 客户 的 数据 报 文 段 中 的 。 

第 三 个 报 文 段 是 从 客户 发 往 服务 器 的 。 它 的 唯一 目的 是 确认 已 从 服务 器 收 到 的 数据 : 
(前 面 讲 过 ， 第 二 个 报 文 段 中 包含 的 数据 是 字符 “C ” ， 是 从 服务 器 到 客户 的 。) 该 报 文 段 
的 数据 字段 为 空 〈 即 确认 信息 没有 被 任何 从 客户 到 服务 器 的 数据 所 朱 带 ) ， 该 报 文 段 的 确 
认 号 字段 填 人 的 是 80， 因 为 客户 已 经 收 到 了 字 节 流 中 序号 为 79 及 以 前 的 字 节 ， 它 现在 正 
等 待 看 字 节 80 的 出 现 。 你 可 能 认为 这 有 点 奇怪 ， 即 使 该 报 文 段 里 没有 数据 还 仍 有 序号 。 
这 是 因为 TCP 存在 序号 字段 ， 报 文 段 需要 填 人 某 个 序号 。 


3.5.3 往返 时 间 的 估计 与 超时 
TCP 如 同 前 面 3. 4 节 所 讲 的 rdt 协议 一 样 ， 它 采用 超时 / 重 传 机 制 来 处 理 报 文 段 的 丢失 
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问题 。 尽 管 这 在 概念 上 简单 .但 是 当 在 如 TCP 这 样 的 实际 协议 中 实现 超时 / 重 传 机 制 时 还 
是 会 产生 许多 微妙 的 问题 。 也 许 最 明显 的 一 个 问题 就 是 超时 间 隅 长 度 的 设置 。 显 然 ， 超 时 
轩 隅 必须 大 于 该 连接 的 往返 时 间 (RTT)， 即 从 一 个 报 文 段 发 出 到 它 被 确认 的 时 间 。 否 则 
会 造成 不 必要 的 重 传 。 但 是 这 个 时 间 间 隔 到 底 应 该 是 多 大 呢 ?” 刚 开始 时 应 如 何 估 计 往 返 时 
EIE? 是 否 应 该 为 所 有 未 确认 的 报 文 段 各 设 一 个 定时 需 ? 问题 如 此 之 多 ! 我 们 在 本 节 中 的 
讨论 基于 [Jacobson 1988] 中 有 关 TCP 的 工作 以 及 IETF 关于 管理 TCP 定时 器 的 建议 
| RFC 6298 | 

1， 估 计 往 返 时 间 

我 们 开始 学 习 TCP 定时 带 的 管理 问题 ， 要 考虑 一 下 TCP 是 如 何 估计 发 送 方 与 接收 方 
之 间 往 返 时 间 的 。 这 是 通过 如 下 方法 完成 的 。 报 文 段 的 样本 RTT (表示 为 SampleRTT) 就 
EMERE AR (BA IP) 到 对 该 报 文 段 的 确认 被 收 到 之 间 的 时 间 量 。 大 多 数 TCP 
的 实现 仅 在 某 个 时 刻 做 一 次 SampleRTT 测量 ， 而 不 是 为 每 个 发 送 的 报 文 段 测量 一 个 Samp- 
leRTT。， 这 就 是 说 ， 在 任意 时 刻 ， 仅 为 一 个 已 发 送 的 但 目前 尚未 被 确认 的 报 文 段 估 计 Samp- 
leRIT， 从 而 产生 一 个 接近 每 个 RTT 的 新 SampleRTT 值 。 另 外，TCP 决 不 为 已 被 重 传 的 报 
文 段 计 算 SampleRTT; 它 仅 为 传输 一 次 的 报 文 段 测 量 SampleRTT [ Kan 1987]. (本章 后 面 
的 一 个 习题 请 你 考虑 一 下 为 什么 要 这 么 做 ,) 

显然 ， 由 于 路 由 需 的 拥塞 和 桨 系统 负载 的 变化 ， 这 些 报 文 段 的 SampleRTT 值 会 随 之 波 
动 . 由 于 这 种 波动 ,任何 给 定 的 SampleRTT 值 也许 都 是 非典 型 的 。 因 此 ， 为 了 估计 一 个 典 
型 的 RTT， 自 然 要 采取 某 种 对 SampleRTT 取 平 均 的 办 法 。TCP 维持 一 个 SampleRTT 均值 
( 称 为 EstimatedRTT) 。 一 旦 获得 一 个 新 SampleRTT AY, TCP 就 会 根据 下 列 公 式 来 更 新 Esti- 
matedRTT: 

EstimatedRTT = (1 -a@) + EstimatedRTT + a@ + SampleRTT 

上 面 的 公式 是 以 编程 语言 的 语句 方式 给 出 的 ， 即 EstimatedRTT 的 新 值 是 由 以 前 的 Esti- 
matedRTT 值 与 SampleRTT 新 值 加 权 组 合 而 成 的 -。 在 [RFC 6298) 中 给 出 的 a 参考 值 是 
a=0.125 ( 即 1/8)， 这 时 上 面 的 公式 变 为 : 

EstimatedRTT =0. 875 + EstimatedRTT +0. 125 - SampleRTT 

值得 注意 的 是 ，EstimatedRTT 是 一 个 SampleRTT 值 的 加 权 平 均值 。 如 在 本 章 后 面 习题 
中 讨论 的 那样 ， 这 个 加 权 平 均 对 最 近 的 样本 赋予 的 权 值 要 大 于 对 老 样 本 赋予 的 权 值 。 这 是 
很 目 然 的 ， 因 为 越 近 的 样本 越 能 更 好 地 反映 网 络 的 当前 拥塞 情况 。 从 统计 学 观点 讲 ， 这 种 
平均 被 称 为 指数 加 权 移 动 平 均 ( Exponential Weighted Moving Average, EWMA), E EWMA 
中 的 “指数 ”一 词 看 起 来 是 指 一 个 给 定 的 SampleRTT 的 权 值 在 更 新 的 过 程 中 呈 指 数 型 快速 
发 减 。 在 课 后 习题 中 ， 将 要 求 你 推导 出 EstimatedRTT 的 指数 表达 形式 。 

图 3-32 显示 了 当 a =1/8 时 ， 在 gaia. cs. umass. edu (在 美国 马 陕 诸 塞 州 的 Amherst) 与 
fantasia. eurecom. 位 〈 在 法 国 南 部 ) 之 间 的 一 条 TCP 连接 上 的 SampleRTT 值 与 EstimatedRTT 
(A. $I., SampleRTT 的 变化 在 计算 EstimatedRTT 的 过 程 中 趋 于 平缓 。 

除了 估算 RTT 外 , 测量 RIT 的 变化 也 是 有 价值 的 。 RFC 6298」 定义 了 RIT 偏差 
DevRTT， 用 于 估算 SampleRTT — E f i EstimatedRTT 的 程度 : 

DevRTT =(1-B) + DevRTT +8 ， | SampleRTT - EstimatedRTT | 
注意 到 DevRTT 是 一 个 SampleRTT 与 EstimatedRTT 之 间 差 值 的 EWMA。 如 果 SampleRTT 
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值 波动 较 小 ， 那 么 DevRTT 的 值 就 会 很 小 ; 另 一 方面 ， 如 果 波 动 很 大 ， 那 么 DevRTT 的 值 
就 会 很 大 。B 的 推荐 值 为 0. 25 。 


2 250 样本 RIT | | | | | | | | 
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图 3-32 RTT 样本 和 RTT 估计 


2. 设置 和 管理 重 传 超时 间隔 

假设 已 经 给 出 了 EstimatedRTT 值 和 DevRTT 值 ， 那 么 TCP 超时 间 隅 应 该 用 什么 值 呢 ? 
很 明显 ， 超 时 间隔 应 该 大 于 等 于 EstimatedRTT， 和 否则 ， 将 造成 不 必要 的 重 传 。 但 是 超时 间 
吧 也 不 应 该 比 EstimatedRTT KAKA, AM SARC REIN, TCP 不 能 很 快 地 重 传 该 报 文 
没 ， 导 致 数据 传输 时 延 大 。 因 此 要 求 将 超时 间隔 设 为 EstimatedRTT 加 上 一 定 余 量 。 > 
SampleRTT 值 波动 较 大 时 ， 这 个 余 量 应 该 大 些 ; 当 波 动 较 小 时 ， 这 个 余 量 应 该 小 些 。 
此 ，DevRTT 值 应 该 在 这 里 发 挥 作用 了 。 在 TCP 的 确定 a a. 所 有 这 和 
因 系 者 考虑 到 了 

TimeoutInterval = EstimatedRTT +4 +» DevRTT 

推荐 的 初始 TimeoutInterval 值 为 1 秒 | RFC 6298]. 同样 ， 当 出 现 超时 后 ，TimeoutInt- 
erval 值 将 加 倍 ， 以 免 即 将 被 确认 的 后 继 报 文 段 过 早出 现 超时 。 不 管 怎样 ， 一 旦 报 文 段 收 到 
并 更 新 EstimatedRTT 后 ，TimeoutInterval 就 又 使 用 上 述 公 式 计 算 了 。 





与 我 们 在 3.4 节 中 所 学 的 方法 很 像 ，TCP 通过 使 用 肯定 确认 与 定时 器 来 提供 可 靠 数 


据 传输 。TCP 确认 正确 接收 到 的 数据 ， 而 当 认 为 报 文 段 或 其 确认 报 文 丢失 或 受 损 时 ， 
TCP 会 重 传 这 些 报 文 段 。 有 些 版 本 的 TCP 还 有 一 个 隐 式 NAK 机 制 (在 TCP 的 快速 重 伟 
机 制 下 ， 收 到 对 一 个 特定 报 文 段 的 3 NIA ACK 就 可 作为 对 后 面 报 文 段 的 一 个 隐 式 
NAK， 从 而 在 超时 之 前 触发 对 该 报 文 段 的 重 传 。TCP 使 用 一 系列 编号 以 使 接收 方 能 识别 
丢失 或 重复 的 报 文 段 。 像 可 靠 数据 传输 协议 rdt3. 0 的 情况 一 样 ，TCP 自己 也 无 法 确认 一 
个 报 文 段 或 其 ACK 是 丢失 了 还 是 受 损 了 ， 或 是 时 延 过 长 了 。 在 发 送 方 ，TCP 的 响应 是 
相同 的 : 重 传 有 问题 的 报 文 段 。 
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TCP 也 使 用 流水 线 ， 使 得 发 送 方 在 任意 时 刻 都 可 以 有 多 个 已 发 出 但 还 未 被 确认 的 报 
文 段 存在 。 我 们 在 前 面 已 经 看 到 ， 当 报 文 段 长 度 与 往返 时 延 之 比 很 小 时 ， 流 水 线 可 显 着 
地 增加 一 个 会 话 的 否 吐 量 。 一 个 发 送 方 可 以 具有 的 未 被 确认 报 文 段 的 确切 个 数 是 由 CP 
的 流量 控制 和 拥塞 控制 机 制 决定 的 。TCP 流量 控制 将 在 本 节 后 面 讨论 ; TCP 拥塞 控制 将 
在 3.7 PPI, 我们 暂时 只 需 知道 TCP 发 送 方 使 用 了 流水 线 即 可 


3.5.4 可 靠 数据 传输 


前 面 讲 过 ， 因 特 网 的 网 络 层 服务 (IP 服务 ) 是 不 可 靠 的 。 卫 不 保证 数据 报 的 交付 ， 
不 保证 数据 报 的 按 序 交付 ， 也 不 保证 数据 报 中 数据 的 完整 性 。 对 于 IP 服务 ， 数 据 报 能 够 
溢出 路 由 器 缓存 而 永远 不 能 到 达 目 的 地 ， 数 据 报 也 可 能 是 乱 序 到 达 ， 而 且 数 据 报 中 的 比特 
可 能 损坏 (由 0 变 为 1 或 者 相反 )。 由 于 运输 层 报 文 段 是 被 IP 数据 报 携带 着 在 网 络 中 传输 
的 ， 所 以 运输 层 的 报 文 段 也 会 遇 到 这 些 问 题 。 

TCP 在 IP 不 可 靠 的 尽力 而 为 服务 之 上 创建 了 一 种 可 靠 数据 传输 服务 (reliable data 
transfer service), TCP 的 可 靠 数据 传输 服务 确保 一 个 进程 从 其 接收 缓存 中 谈 出 的 数据 流 是 
无 损坏 、 无 间隔 、 非 元 余 和 按 序 的 数据 流 ; 即 该 字 节 流 与 连接 的 另 一 方 庙 系统 发 送出 的 字 
节 流 是 完全 相同 。TCP 提供 可 靠 数 据 传输 的 方法 涉及 我 们 在 3.4 节 中 所 学 的 许多 原理 ， 

在 我 们 前 面 研发 可 靠 数据 传输 技术 时 ， 兽 假定 每 一 个 已 发 送 但 未 被 确认 的 报 文 段 者 与 
一 个 定时 器 相关 联 ， 这 在 概念 上 是 最 简单 的 。 虽 然 这 在 理论 上 很 好 ， 但 定时 器 的 管理 却 需 
要 相当 大 的 开销 。 因 此 ， 推 荐 的 定时 器 管理 过 程 [RFC 6298] 仅 使 用 单一 的 重 传 定 时 器 ， 
即使 有 多 个 已 发 送 但 还 未 被 确认 的 报 文 段 。 在 本 节 中 描述 的 TCP 协议 遵循 了 这 种 单一 定时 
带 的 推荐 。 

我 们 将 以 两 个 递增 的 步骤 来 讨论 TCP 是 如 何 提供 可 靠 数据 传输 的 。 我 们 先 给 出 一 个 TCP 
发 送 方 的 高 度 简化 的 描述 ， 该 发 送 方 只 用 超时 来 恢复 报 文 段 的 丢失 ; 然后 再 给 出 一 个 更 全 面 
的 描述 ， 该 描述 中 除了 使 用 超时 机 制 外 ， 还 使 用 宛 余 确认 技术 。 在 接 下 来 的 讨论 中 ， 我 们 假 
定数 据 仅 向 一 个 方向 发 送 ， 即 从 主机 A 到 主机 B， 且 主机 A 在 发 送 一 个 大 文件 。 

图 3-33 给 出 了 一 个 TCP 发 送 方 高 度 简化 的 描述 。 我 们 看 到 在 TCP 发 送 方 有 3 个 与 发 
送 和 重 传 有 关 的 主要 事件 : 从 上 层 应 用 程序 接收 数据 ; 定时 器 超时 和 收 到 ACK。 一 旦 第 一 
个 主要 事件 发 生 ，TCP 从 应 用 程序 接收 数据 ， 将 数据 封装 在 一 个 报 文 段 中 ， 并 把 该 报 文 段 
交 给 IP。 注 意 到 每 一 个 报 文 段 都 包含 一 个 序号 ， 如 3. 5. 2 节 所 讲 的 那样 ， 这 个 序号 就 是 该 
报 文 段 第 一 个 数据 字 节 的 字 节 流 编号 。 还 要 注意 到 如 果 定 时 需 还 没有 为 革 些 其 他 报 文 段 而 
运行 ， 则 当 报 文 段 被 传 给 IP 时 ，TCP 就 启动 该 定时 器 。( 将 定时 做 想 象 为 与 最 早 的 未 被 确 
认 的 报 文 段 相 关联 是 有 帮助 的 ,) 该 定时 器 的 过 期 间隔 是 TimeoutInterval， 它 是 由 3.5.3 市 
中 所 描述 的 EstimatedRTT 和 DevRTT 计算 得 出 的 。 

第 二 个 主要 事件 是 超时 。TCP 通过 重 传 引起 超时 的 报 文 段 来 响应 超时 事件 。 然 后 TCP 
HA EAT AR o 

TCP 发 送 方 必须 处 理 的 第 三 个 主要 事件 是 一 个 来 自 接收 方 的 确认 报 文 段 (ACK) 的 到 
达 (更 确切 地 说 是 一 个 包含 了 有 效 ACK 字段 值 的 报 文 段 )。 当 该 事件 发 生 时 ，TCP 将 ACK 
的 值 y 与 它 的 变量 SendBase 进行 比较 。TCP 状态 变量 SendBase 是 最 早 示 被 确认 的 字 市 的 


> 

t 
~A 
Kp 
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序号 。( 因此 SendBase -1 FRIA LE WA FE Py PE BY RE in PE a) 如 
前 面 指出 的 那样 ，TCP 采用 累积 确认 ， 所 以 y mA TETE y 之 前 的 所 有 字 节 者 已 经 收 
j. WR y >SendBase， 则 该 ACK 是 在 确认 一 个 或 多 个 先前 未 被 确认 的 报 文 段 ，。 因 此 发 送 方 
更 新 它 的 SendBase 变量 ; 如 果 当 前 有 未 被 确认 的 报 文 段 ，TCP 还 要 重新 局 动 定 时 澡 . 


/* 假设 发 送 方 不 受 TCP 流 量 和 拥塞 控制 的 限制 来 自 上 晨 的 数据 长 度 小 于 MSS， 昌 数据 传送 只 在 一 个 
方向 进行 。*/ 


NextSeqNum=InitialSeqNumber 
SendBase=InitialSeqNumber 





loop (forever) { 
switch(event) 


event: data received from application above 
create TCP segment with sequence number NextSeqNum 
if (timer currently not running) 
start timer 
pass segment to IP 
NextSeqNum=NextSeqNum+length(data) 
break; 


event: timer timeout 
retransmit not-yet-acknowledged segment with 
smallest sequence number 
start timer 
break; 


event: ACK received, with ACK field value of y 
if (y > SendBase) { 
SendBase=y 
if (there are currently any not-yet-acknowledged segments) 
start timer 


} 


break; 


} /* forever 循环 结束 */ 
图 3-33 人 简化 的 TCP 发 送 方 


1. 一 些 有 趣 的 情况 

我 们 刚刚 描述 了 一 个 关于 TCP 如 何 提 供 可 徘 数 据 传输 的 高 度 简 化 的 版 本 ,但 即使 这 种 
高 度 简 化 的 版 本 ， 仍 然 存 在 着 许多 微妙 之 处 。 为 了 较 好 地 感受 该 协议 的 工作 过 程 ， 我 们 来 
看 几 种 简单 情况 。 图 3-34 描述 了 第 一 种 情况 ， 主 机 A 向 主机 B 发送 一 个 报 文 段 。 假 设 该 
报 文 段 的 序号 是 92 ， 而 且 包 含 8 字 节 数据 。 在 发 出 该 报 文 段 之 后 ， 主 机 A 等 待 一 个 来 自 
主机 B 的 确认 号 为 100 的 报 文 段 。 虽 然 A 发 出 的 报 文 段 在 主机 B 上 被 收 到 ， 但 从 主机 B 
发 往 主机 A 的 确认 报 文 丢 失 了 。 在 这 种 情况 下 ， 超 时 事件 就 会 发 生 ， 主 机 A 会 重 传 相同 
的 报 文 段 。 当 然 ， 当 主机 B 收 到 该 重 传 的 报 文 段 时 ， 它 将 通过 序号 发 现 该 报 文 段 包 含 了 早 
已 收 到 的 数据 。 因 此 ， 主 机 B 中 的 TCP 将 丢弃 该 重 传 的 报 文 段 中 的 这 些 字 市 。 

在 第 二 种 情况 中 ， 如 图 3-35 所 示 ， 主 机 A 连续 发 回 了 两 个 报 文 段 。 第 一 个 报 文 段 序 
号 是 92， 包 含 8 字 节 数据 ; 第 二 个 报 文 段 序 号 是 100， 包 含 20 字 届 数据。 假设 两 个 报 文 段 
都 完好 无 损 地 到 达 主 机 B， 并 且 主 机 B 为 每 一 个 报 文 段 分 别 发 送 一 个 确认 。 第 一 个 确认 报 
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文 的 确认 号 是 100， 第 二 个 确认 报 文 的 确认 号 是 120。 现 在 假设 在 超时 之 前 这 两 个 报 文 段 
中 没有 一 个 人 确认 报 文 到 达 主 机 A。 当 超时 事件 发 生 时 ， 主 机 A 重 传 序号 92 的 第 一 个 报 文 
段 ， 并 重启 定时 各。 只 要 第 二 个 报 文 段 的 ACK 在 新 的 超时 发 生 以 前 到 达 ， 则 第 二 个 报 文 





时 间 


时 间 


图 3-34 由 于 确认 丢失 而 重 传 


主机 A 主机 B 






Seg = 92 


超时 间隔 


Seq = 92 | 


超时 间隔 





时 间 时 间 


图 3-35 FROCK 100 没有 重 传 


在 第 三 种 也 是 最 后 一 种 情况 中 ,假设 主机 A 与 在 第 二 种 情况 中 完全 一 样 ， 发 送 两 个 报 


ME. 
Ay 120 的 确认 报 文 。 主机 A 因而 知道 主机 
B 已 经 收 到 了 序号 为 119 RZ AY PA ET 
所 以 主机 A 不 会 重 传 这 两 个 报 文 段 中 的 任何 
一 个 - 这 种 情况 在 图 3-36 中 进行 了 图 示 。 

2. 超时 间隔 加 倍 

我 们 现在 讨论 一 下 在 大 多 数 TCP 实现 中 
所 做 的 一 些 修 改 。 首 先 关 注 的 是 在 定时 需 时 
限 过 期 后 超时 间隔 的 长 度 。 在 这 种 修改 中 ， 
每 当 超时 事件 发 生 时 ， 如 前 所 述 ，TCP 重 传 
具有 最 小 序号 的 还 未 被 确认 的 报 文 段 。 只 是 
每 次 TCP 重 传 时 都 会 将 下 一 次 的 超时 间隔 设 
为 先前 值 的 两 倍 ， 而 不 是 用 从 EstimatedRTT 
和 DevRTT 推算 出 的 值 (如 在 3. 5.3 节 中 所 
摘 述 的 ) 。 例 如， 假 设 当 定时 需 第 一 次 过 期 
时 ,与 最 早 的 未 被 确认 的 报 文 段 相关 联 的 
TimeoutInterval 是 0.75 #>. TCP 就 会 重 传 该 


第 一 个 报 文 段 的 确认 报 文 在 网 络 丢 失 , 但 在 超时 事件 发 生 之 前 主机 A 收 到 一 个 确认 





Seq = 92 | : 


超时 间隔 | - 


时 间 
图 3-36 累积 确认 避免 了 第 一 个 报 文 段 的 重 传 


? 
时 间 
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报 文 段 ， 并 把 新 的 过 期 时 间 设 置 为 1.5 秒 。 如 果 1.5 Pea aa Ma WW TCP 将 再 次 
重 传 该 报 文 段 ， 并 把 过 期 时 间 设 置 为 3.0 秒 . 因此 ， 超 时 间隔 在 每 次 重 传 后 会 呈 指 数 型 增 
长 。 然 而 ， 每 当 定 时 融 在 另 两 个 事件 〈( 即 收 到 上 层 应 用 的 数据 和 收 到 ACK) 中 的 任意 一 
个 局 动 时 ，Timeoutlnterval 由 最 近 的 EstimatedRTT 值 与 DevRTT 值 推算 得 到 . 

这 种 修改 提供 了 一 个 形式 受 限 的 拥塞 控制 . (更 复杂 的 TCP 拥塞 控制 形式 将 在 3.7 节 
Peo.) 定时 各 过 期 很 可 能 是 由 网 络 拥塞 引 起 的 ， 即 太 多 的 分 组 到 达 源 与 日 的 地 之 间 路 
径 上 的 一 台 (或 多 台 ) 路 由 此 的 队列 中 ， 造 成 分 组 丢失 或 长 时 间 的 排队 时 延 。 在 拥塞 的 时 
修 ， 如 果 源 持续 重 传 分 组 ， 会 使 拥塞 更 加 严重 。 相 反 ，TCP 使 用 更 文雅 的 方式 ， 每 个 发 送 
方 的 重 传 都 是 经 过 越 来 越 长 的 时 间 间 隔 后 进行 的 ， 当 我 们 在 第 $ 章 学 习 CSMA/CD 时 ,将 
看 到 以 太 网 采用 了 类 似 的 思路 。 

3. 快速 重 传 

超时 触发 重 传 存 在 的 问题 之 一 是 超时 周期 可 能 相对 较 长 。 当 一 个 报 文 段 丢 失 时 ， 这 种 
长 超时 周期 迫使 发 送 方 延迟 重 传 琉 失 的 分 组 ， 因 而 增加 了 端 到 端 时 延 。 幸 运 的 是 ， 发 送 方 
通常 可 在 超时 事件 发 生 之 前 通过 注意 所 谓 宛 余 ACK 来 较 好 地 检测 到 丢 包 情况 。 宛 余 ACK 
(duplicate ACK) 就 是 再 次 确认 某 个 报 文 段 的 ACK， 而 发 送 方 先前 已 经 收 到 对 该 报 文 段 的 
确认 。 要 理解 发 送 方 对 元 余 ACK 的 响应 ， 我 们 必须 首先 看 一 下 接收 方 为 什么 会 发 送 宛 余 
ACK, 表 3-2 45 T TCP 接收 方 的 ACK 生成 策略 | RFC 5681]. “4 TCP 接收 方 收 到 一 个 具 
有 这 样 序号 的 报 文 段 时 ， 即 其 序号 大 于 下 一 个 所 期 望 的 、 按 序 的 报 文 段 ， 它 检测 到 了 数据 
流 中 的 一 个 间隔 ， 这 就 是 说 有 报 文 段 丢 失 。 这 个 间隔 可 能 是 由 于 在 网 络 中 报 文 段 丢 失 或 重 
新 排序 造成 的 。 因 为 TCP 不 使 用 否定 确认 ， 所 以 接收 方 不 能 向 发 送 方 发 回 一 个 显 式 的 否定 
确认 。 相 反 ， 它 只 是 对 已 经 接收 到 的 最 后 一 个 按 序 字 节 数 据 进 行 重复 确认 ( 即 产 生 一 个 页 
R ACK) 即 可 。( 注 意 到 在 表 3-2 中 允许 接收 方 不 丢弃 失 序 报 文 段 ,) 

表 3-2 产生 TCP ACK 的 建议 [RFC 5681 ] 
事件 TCP 接收 方 动 作 

具有 所 期 望 序号 的 按 序 报 文 段 到 达 。 所 延迟 的 ACK。 对 男 一 个 按 序 报 文 段 的 到 达 最 多 等 待 5S00ms， 如 果 下 
有 在 期 望 序号 及 以 前 的 数据 都 已 经 被 确认 一 个 按 序 报 文 段 在 这 个 时 间 问 隔 内 设 有 到 达 ， 则 发 送 一 个 ACK 

具有 所 期 望 序号 的 按 序 报 文 段 到 达 。 男 立即 发 送 单 个 累积 ACK， 以 确认 两 个 按 序 报 文 段 
-个 按 序 报 文 段 等 待 ACK 传输 

比 期 望 序号 大 的 失 序 报 文 段 到 达 。 检 测 
出 间隔 


能 部 分 或 完全 填充 接收 数据 间隔 的 报 文 
段 到 达 











立即 发 送 元 余 ACK， 指 示 下 一 个 期 待 字 节 的 序号 ( 其 为 间隔 的 低 站 
的 序号 
倘若 该 报 文 段 起 始 于 间隔 的 低 端 ， 则 立即 发 送 ACK 





因为 发 送 方 经 常 一 个 接 一 个 地 发 送 大 量 的 报 文 段 ， 如 果 一 个 报 文 段 丢失 ， 就 很 可 能 引 
起 许多 一 个 接 一 个 的 元 余 ACK。 如 果 TCP 发 送 方 接收 到 对 相同 数据 的 3 个 元 余 ACK, € 
把 这 当 作 一 种 指示 ， 说明 跟 在 这 个 已 被 确认 过 3 次 的 报 文 段 之 后 的 报 文 段 已 经 丢失 。 (在 
诛 后 习题 中 ， 我 们 将 考虑 为 什么 发 送 方 等 待 3 个 元 余 ACK， 而 不 是 仅仅 等 待 一 个 元 余 
ACK.) 一 旦 收 到 3 AICA ACK, TCP 就 执行 快速 重 传 (fast retransmit) | RFC 5681], HJ 
在 该 报 文 段 的 定时 需 过 期 之 前 重 传 丢 失 的 报 文 段 。 对 于 采用 快速 重 传 的 TCP， 可 用 下 列 代 
fy Fr BAR RI 3-33 中 的 ACK 收 到 事件 : 
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event: ACK received, with ACK field value of y 
if (y > SendBase) { 
SendBase=y 
if (there are currently any not yet 
acknowledged segments) 
start timer 


} 
else { /* a duplicate ACK for already ACKed 


segment */ 
increment number of duplicate ACKs 
received for y 
if (number of duplicate ACKS received 
for y==3) 
/* TCP fast retransmit */ 
resend segment with sequence number y 


} 


break; 

前 面 讲 过 ， 当 在 如 TCP 这 样 一 个 实际 
协议 中 实现 超时 / 重 传 机 制 时 ， 会 产生 许多 
做 妙 的 问题 。 上 面 的 过 程 是 在 超过 20 年 的 
TCP 定时 需 使 用 经 验 的 基础 上 演化 而 来 的 ， 
Wi 和 理解 实际 情况 确实 是 这 样 的 。 

4. 是 回 退 入 步 还 是 选择 重 传 

考虑 下 面 这 个 问题 来 结束 有 关 TCP 差 
错 恢复 机 制 的 学 习 : TCP 是 一 个 CBN 协议 iene 
还 是 一 个 SR 协议 ?前 面 讲 过 ，TCP 确认 是 | ack=100 
累积 式 的 ， 正 确 接收 但 失 序 的 报 文 段 是 不 会 
馈 接 收 方 途 个 确认 的 。 因 此 ， 如 图 3-33 所 
示 〈 也 可 参见 图 3-19)，TCP 发 送 方 仅 需 维 ! 
持 已 发 送 过 但 未 被 确认 的 字 节 的 最 小 序号 E 
(SendBase) 和 下 一 个 要 发 送 的 字 节 的 序号 
(NextSeqNum ) 。 在 这 种 意义 下 ，TCP 看 起 
来 更 像 一 个 GBN 风格 的 协议 。 但 是 TCP 和 L 
CBN 协议 之 间 有 着 一 些 显著 的 区 别 。 许 多 时 间 时 间 
TCP 实现 会 将 正确 接收 但 失 厅 的 报 文 段 缓存 。 图 3-37 快速 重 传 : 在 某 报 文 段 的 定时 器 过 期 
起 来 [Stevens 1994 ] 。 另 外 考虑 一 下 ， 当 发 之 前 重 传 丢失 的 报 文 段 
ee 股 1，2，…，N， 并 且 所 有 的 报 文 段 都 按 序 无 差错 地 到 达 接 收 方 时 会 发 
生 的 情况 。 进 一 步 假 设 对 分 组 n <N 的 确认 报 文 丢失 ， 但 是 其 余 V -1 个 确认 报 文 在 分 别 超时 
sprite 这 时 又 会 发 生 的 情况 。 在 该 例 中 ，GBN 不 仅 会 重 传 分 组 n， 还 会 重 传 所 有 
后 继 的 分 组 n+1，n +2,，…，N。 在 男 一 方面 ，TCP 将 重 传 至 多 一 个 报 文 段 ， 即 报 文 段 %。 此 
外 ， 如 果 对 报 文 段 n+1 的 确认 报 文 在 报 文 段 n 超时 之 前 到 达 ，TCP 其 至 不 会 午 传 报 文 段 nn。 

XT TCP 提出 的 一 种 修改 意见 是 所 谓 的 选择 确认 (selective acknowledgment) | RFC 2018 | , 
EIF TCP 接收 方 有 选择 地 确认 失 序 报 文 段 ， 而 不 是 累积 地 确认 最 后 一 个 正确 接收 的 有 序 
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地 确认 过 的 报 文 段 ) TCP 看 起 来 就 很 像 我 们 通常 的 SR 协议 。 因 此 ，TCP 的 差错 恢复 机 制 
也 许 最 好 被 分 类 为 CBN 协议 与 SR 协议 的 混合 体 。 


3.5.5 流量 控制 


前 面 讲 过 ， 一 条 TCP 连接 每 一 侧 主 机 者 为 该 连接 设置 了 接收 缓存 。 当 该 TCP 连接 收 
到 正确 、 按 序 的 字 节 后 ， 它 就 将 数据 放 人 接收 缓存 。 相 关联 的 应 用 进程 会 从 该 缓存 中 斌 取 
数据 ， 但 不 必 是 数据 刚 一 到 达 就 立即 该 取 。 事实 上 ， 接 收 方 应 用 也 许 正 忙于 其 他 任务 ， 其 
至 要 过 很 长 时 间 后 才 去 谈 取 该 数据 。 如果 某 应 用 程序 读 取 数据 时 相对 缓慢 ， 而 上 发送 方 帮 大 
得 太 多 、 太 快 ， 发 送 的 数据 就 会 很 容 匈 地 使 该 连接 的 接收 缓存 次 出 : 

TCP 为 它 的 应 用 程序 提供 了 流量 控制 服务 (flow-control service) 以 消除 发 送 方 使 接收 方 
绥 存 洲 出 的 可 能 性 。 流 量 控制 因此 是 一 个 速度 匹配 服务 ， 即 发 送 方 的 发 送 速 率 与 接收 方 应 用 
程序 的 读 取 速率 相 匹 配 。 前 面 提 到 过 ，TCP 发 送 方 也 可 能 因为 IP 网 络 的 拥塞 而 被 电 制 ; 这 种 
形式 的 发 送 方 的 控制 被 称 为 拥塞 控制 (congestion control ) ， 我 们 将 在 3.6 市 和 3.7 市 详细 地 
讨论 这 个 主题 ， 即 使 流量 控制 和 拥 寄 控制 采取 的 动作 非常 相似 (对 发 送 方 的 过 制 )， 但 是 它 
们 显然 是 针对 完全 不 同 的 原因 而 采取 的 措施 .不 香 的 是 ,许多 作者 把 这 两 个 术语 混用 ， 理 解 
力 强 的 读者 会 明智 地 区 分 这 两 种 情况 .现在 我 们 来 讨论 TCP 如 何 提供 流量 控制 服务 的 ,为 了 
能 从 整体 上 看 问题 ， 我 们 在 本 节 都 假设 TCP 是 这 样 实现 的 ， 即 TCP 接收 方 丢 和 茎 失 厅 的 报 文 段 : 

TCP 通过 让 发 送 方 维 护 一 个 称 为 接收 窗口 (receive window) 的 变量 来 提供 流量 控制 。 
通俗 地 说 ， 接 收 窗口 用 于 给 发 送 方 一 个 指示 该 接收 方 还 有 多 少 可 用 的 缓存 空间 。 央 为 
TCP 是 全 双 工 通信 ， 在 连接 两 端的 发 送 方 都 各 日 维护 一 个 接收 窗口 。 我 们 在 文件 传输 的 情 
Ot wae PE BA. TRB EBL A 通过 一 条 TOP 连接 向 主机 B 发 送 一 个 大 文件 。 主机 B 为 
该 连接 分 配 了 一 个 接收 缓存 ， 并 用 RevBuffer 来 表示 其 大 小 。 主 机 B 上 的 应 用 进程 不 时 地 
从 该 缓存 中 该 取 数 据 。 我 们 定义 以 下 变量 : 

e LastByteRead: 主机 B 上 的 应 用 进程 从 绥 存 读 出 的 数据 流 的 最 后 一 个 字 太 的 强 写 . 

。 LastByteRevd: 从 网 络 中 到 达 的 并 且 已 放 入 主机 B 接收 缓存 中 的 数据 流 的 最 后 一 个 

EPAI 
由 于 TCP A RIFE DAIR G, FIIU : 
LastByteRevd — LastByteRead < RevBuffer 
接收 窗口 用 rwnd 表示 ， 根 据 缓存 可 用 空间 的 数量 来 设置 : 
rwnd = RevBuffer ~ | LastByteRevd - LastByteRead | 

由 于 该 空间 是 随 着 时 间 变 化 的 ， 所 以 
rwnd 是 动态 的 。 图 3-38 对 变量 rwnd 进行 
SAA. 

连接 是 如 何 使 用 变量 rwnd 提供 流量 





RecvBuffer 


rwnd 


控制 服务 的 呢 ? 主机 B 通过 把 当前 的 。 的 数据 HR 





rwnd 值 放 入 它 发 给 主机 A 的 报 文 段 接收 
窗口 字段 中 ， 通 知 主机 A 它 在 该 连接 的 绥 
存 中 还 有 多 少 可 用 空间 。 开 始 时 ， 主 机 B A 
设 定 wnd = RevBuffer。 注 意 到 为 了 实现 这 图 3-38 接收 窗口 (rwnd) 和 接收 缓存 (RevBuffer) 
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一 点 ， 主 机 B 必须 跟踪 几 个 与 连接 有 关 的 变量 : 

主机 A 轮流 跟踪 两 个 变量 ，LastByteSent 和 LastBvyteAcked ， 这 两 个 变量 的 意义 很 明显 . 
注意 到 这 两 个 变量 之 间 的 差 LastByteSent - LastByteAcked， 就 是 主机 A 发 送 到 连接 中 但 未 
被 确认 的 数据 量 。 通 过 将 未 确认 的 数据 量 控制 在 值 rwnd 以 内 ， 就 可 以 保证 主机 A 不 会 使 
主机 B 的 接收 缓存 洲 出 。 因 此 ， 主 机 A 在 该 连接 的 整个 生命 周期 须 保 证 : 

LastByteSent - LastByteAcked < rwnd 

对 于 这 个 方案 还 存在 一 个 小 小 的 技术 问题 。 为 了 理解 这 一 点 ， 假 设 主 机 B 的 接收 绥 
存 已 经 存 满 ， 使 得 rwnd =0。 在 将 rwnd =0 通告 给 主机 A 之 后 ， 还 要 假设 主机 B 没有 任 
何 数据 要 发 给 主机 A。 此 时 ， 考虑 会 发 生 什么 情况 .因为 主机 B 上 的 应 用 进程 将 组 和 仓 清 
Z, TCP 并 不 向 主机 A 发 送 带 有 rwnd 新 值 的 新 报 文 段 ; 事实 上 ，TCP 仅 当 在 它 有 数据 
或 有 确认 要 发 时 才 会 发 送 报 文 段 给 主机 A。 这样， 主机 A 不 可 能 知道 主机 B 的 接收 缓存 
已 经 有 新 的 空间 了 ， 即 主机 A ERASE I AE FE AIK BG | 为 了 解决 这 个 问题 ，TCP 规范 
中 要 求 : 当主 机 B 的 接收 窗口 为 0 时 ， 主 机 A 继续 发 送 只 有 一 个 衬 市 数据 的 报 文 段 。 这 
些 报 文 段 将 会 被 接收 方 确认 。 最 终 缓 存 将 开始 清空 ， 并 且 确 认 报 文 里 将 包含 一 个 非 0 的 
rwnd 值 - 

位 于 http://www. awl. com/kurose- ross 的 在 线 站 点 为 本 书 提 供 了 一 个 交互 式 Java 小 程 
序 ， 用 以 说 明 TCP 接收 窗口 的 运行 情况 。 

描述 了 TCP 的 流量 控制 服务 以 后 ， 我 们 在 此 要 简要 地 提 一 下 UDP 并 不 提供 流量 控制 
为 了 理解 这 个 问题 ， 考 虑 一 下 从 主机 A 上 的 一 个 进程 回 主 机 B 上 的 一 个 进程 发 送 一 系列 
UDP 报 文 段 的 情形 。 对 于 一 个 典型 的 UDP 实现 ，UDP 将 会 把 这 些 报 文 段 滩 加 到 相应 套 接 
字 (进程 的 门户 ) “前 面 ” 的 一 个 有 限 大 小 的 缓存 中 。 进 程 每 次 从 缓存 中 旋 取 一 个 完整 的 
报 文 段 。 如 果 进 程 从 缓存 中 读 取 报 文 段 的 速度 不 够 快 ， 那 么 缓存 将 会 洲 出 ， 并 且 将 玉 失 报 


3. 5.6 TCP 连接 管理 


在 本 小 节 中 ， 我 们 更 为 仔细 地 观察 如 何 建立 和 拆除 一 条 TCP 连接 。 尽管 这 个 主题 并 不 
特别 令 人 兴奋 ， 但 是 它 很 重要 ， 因 为 TCP 连接 的 建立 会 显著 地 增加 人 们 感受 到 的 时 延 
(如 在 Web 上 冲浪 时 ) 。 此 外 ， 许 多 和 凋 见 的 网 络 攻 击 〈 包 括 极为 流行 的 SYN 潜 泛 攻击 ) A 
用 了 TCP 连接 管理 中 的 弱点 。 现 在 我 们 观察 一 下 一 条 TCP 连接 是 如 何 建立 的 。 假设 运行 
在 一 台 主 机 (客户) 上 的 一 个 进程 想 与 另 一 台 主 机 (服务器) 上 的 一 个 进程 建立 一 条 连 
接 。 客 户 应 用 进程 首先 通知 客户 TCP， 它 想 建 立 一 个 与 服务 厦 上 某 个 进程 之 间 的 连接 。 客 
户 中 的 TCP SHIVA BS ARS Ae AY TCP 建立 一 条 TCP 连接 : 

e 第 一 步 : 客户 端的 TCP Aco Ae AY TCP 发送 一 个 特殊 的 TCP FR MEL. 该 报 

文 段 中 不 包含 应 用 层 数 据 。 但 是 在 报 文 段 的 首部 (参见 图 3-29) 中 的 一 个 标志 位 
( 即 SYN 比特 ) REANL, 因此， 这 个 特殊 报 文 段 被 称 为 SYN RE BIr, K 
户 会 随机 地 选择 一 个 初始 序号 (client_isn)， 并 将 此 编号 放 竖 于 该 起 始 的 TCP SYN 
报 文 段 的 序号 字段 中 。 该 报 文 段 会 被 封装 在 一 个 IP 数据 报 中 ， 并 发 送 给 服务 融 
为 了 避免 某 些 安全 性 攻击 ， 在 适当 地 随机 化 选择 client_isn Jy (fl 47 A As Fy BRAY HF 
究 [CERT 2001-09]. 
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e 第 二 步 : 一 旦 包含 TCP SYN FROCBeAY IP BIR EIANR SH as EOL (假定 它 的 确 到 达 
了 1!1) ， 服 务 器 会 从 该 数据 报 中 提取 出 TCP SYN 报 文 段 ， 为 该 TCP 连接 分 配 TCP 组 
FARE, FFARR TCP 发 送 允 许 连接 的 报 文 段 。 (我 们 将 在 第 8 HA, ESC 
成 三 次 握手 的 第 三 步 之 前 分 配 这 些 缓存 和 变量 ， 使 得 TCP 易于 受到 称 为 SYN HEZ 
的 拒绝 服务 攻击 。) 这 个 允许 连接 的 报 文 段 也 不 包含 应 用 层 数据 。 但 是 ， 在 报 文 段 
的 首部 却 包含 3 个 重要 的 信息 。 首 先 ，SYN 比特 被 置 为 1。 其 次 ， 该 TCP 报 文 段 
首部 的 确认 号 字段 被 置 为 client_isn +1。 最 后 ， 服 务 天 选择 目 己 的 初始 序号 
(server_isn) ， 并 将 其 放置 到 TCP 报 文 段 首部 的 序号 字段 中 。 这 个 允许 连接 的 报 文 
段 实际 上 表明 了 :“ 我 收 到 了 你 发 起 建立 连接 的 SYN 分 组 ， 该 分 组 市 有 初始 序号 
client_isn。 我 同意 建立 该 连接 。 我 自己 的 初始 序号 是 server_isn。” 该 允许 连接 的 报 
文 段 有 时 被 称 为 SYNACK 报 文 段 (SYNACK segment), 

e 第 三 步 : 在 收 到 SYNACK 报 文 段 后 ， 客 户 也 要 给 该 连接 分 配 缓存 和 变量 。 客 户主 
机 则 回 服 务 器 发 送 另外 一 个 报 文 段 ; 这 最 后 一 个 报 文 段 对 服务 需 的 允许 连接 的 报 
文 段 进行 了 确认 (该 客户 通过 将 值 server_isn + 1 放置 到 TCP 报 文 段 首部 的 确认 字 
段 中 来 完成 此 项 工作 ) 。 因 为 连接 已 经 建立 了 ， 所 以 该 SYN 比特 被 置 为 0。 该 三 次 
握手 的 第 三 个 阶段 可 以 在 报 文 段 负载 中 携 市 客户 到 服务 闫 的 数据 . 

一 旦 完成 这 3 SAR, BP MARS te ESL] DA AK GL MR ME. FEW 
后 每 一 个 报 文 段 中 ，SYN 比特 都 将 被 置 为 0。 注 意 到 为 了 创建 该 连接 ， 在 两 台 主 机 之 间 发 
送 了 3 个 分 组 ， 如 图 3-39 所 示 。 由 于 这 个 原因 ， 这 种 连接 创建 过 程 通 常 被 称 为 3 次 握手 
(three-way handshake), TCP 3 次 握手 的 几 个 方面 将 在 课 后 习题 中 讨论 (为 什么 需要 初始 
序号 ? 为 什么 需要 3 次 握手 ， 而 不 是 两 次 握手 ?) 。 注 意 到 这 样 一 件 事 是 很 有 趣 的 ， 一 个 区 
岩 者 和 一 个 保护 者 (他 位 于 攀岩 者 的 下 面 ， 他 的 任务 是 处 理 好 欧 宕 者 的 安全 绳索 ) 就 使 用 
了 与 TCP 相同 的 3 次 握手 通信 协议 ， 以 确保 在 攀岩 者 开始 攀 仆 前 双方 都 已 经 准备 好 了 。 

客户 主机 


服务 器 主机 






ACK 一 一 一 : 


t i ten, r g 
~ Sny] ~ieny) 
, 


时 间 时 间 
图 3-39 TCP 三 次 握手 : 报 文 段 交 换 
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KPA A Sel, REP TCP 连接 也 是 这 样 。 参 与 一 条 TCP 连接 的 两 个 进程 中 的 
服务 器 


任何 一 个 都 能 终止 该 连接 。 当 连接 结束 
后 ， 主 机 中 的 “资源 ”( 即 缓存 和 变量 ) 
将 被 释放 。 举 一 个 例子 ， 假 设 某 客户 打 
算 关 闭 连 接 ， 如 图 3-40 所 示 。 客 户 应 用 
进程 发 出 一 个 关闭 连接 命令 。 这 会 引起 
客户 TCP. 回 服务 奉 进 程 发 送 一 个 特殊 的 
TCP 报 文 段 。 这 个 特殊 的 报 文 段 让 其 首 
部 中 的 一 个 标志 位 即 FIN 比特 (参见 
图 3-29) 被 设置 为 1。 当 服务 需 接 收 到 
该 报 文 段 后 ， 束 问 发 送 方 回 送 一 个 确认 
报 文 段 。 人 然后， 服务器 发 送 它 自己 的 终 
止 报 文 段 ， 其 FIN 比特 被 置 为 1。 最 后 ， 
该 客户 对 这 个 服务 费 的 终止 报 文 段 进行 
确认 。 此 时 ， 在 两 台 主 机 上 用 于 该 连接 
的 所 有 资源 都 被 释放 了 。 

在 一 个 TCP 连接 的 生命 周期 内 ， 运 行 
在 每 台 主 机 中 的 TCP 协议 在 各 种 TCP 状 
A (TCP state) 之 加 变迁 。 图 3-41 说 明了 





FIN 
ACK 
关闭 
| ACK 
en 
| 
已 关闭 - 
时 间 时 间 


图 3-40 ”关闭 一 条 TCP 连接 


客户 TCP 会 经 历 的 一 系列 典型 TCP 状态 。 客 户 TCP 开始 时 处 于 CLOSED (关闭 ) 状态 。 客 
户 的 应 用 程序 发 起 一 个 新 的 TCP 连接 (可 通过 在 第 2 草 讲 过 的 Python 例子 中 创建 一 个 Socket 


对 象 来 完成 ) 。 这 引起 客户 中 的 TCP 向 服务 器 中 的 TCP 发 送 一 个 SYN 报 文 段 。 


在 发 送 过 SYN 


报 文 段 后 ， 客 户 TCP 进入 了 SYN_SENT 状态 。 当 客户 TCP 处 在 SYN_SENT 状态 时 ， 它 等 待 
KA Hea a TCP 的 对 客户 所 发 报 文 段 进 行 确认 且 SYN 比特 被 置 为 1 的 一 个 报 文 段 。 收 到 这 
样 一 个 报 文 段 之 后 ， 客 户 TCP 进入 ESTABLISHED (已 建立 ) 状态 。 当 处 在 ESTABLISHED 状态 
Hf, TCP 客户 就 能 发 送 和 接收 包含 有 效 载 厨 数据 〈 即 应 用 层 产生 的 数据 ) 的 TCP 报 文 段 了 。 








接收 ACK， 
不 发 送 


图 3-41 





客户 应 用 程序 发 起 
_ 一 个 TCP 连 接 


发 送 SYN 





接收 SYN & ACK, 
发 送 ACK 





发 送 FIN 


客户 应 用 程序 


客户 TCP 经 历 的 典型 的 TCP 状态 序列 
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假设 客户 应 用 程序 决定 要 关闭 该 连接 。( 注 意 到 服务 融 也 能 选择 关闭 该 连接 .) 这 引起 
客户 TCP 发送 一 个 市 有 FIN 比特 被 置 为 1 的 TCP 报 文 段 ， 并 进入 FIN_WAIT_1 状态 ， 当 处 
在 FIN_WAIT_I 状态 时 ， 客户 TCP 等 待 一 个 来 自 服务 需 的 融 有 确认 的 TCP 报 文 段 。 当 它 收 
到 该 报 文 段 时 ， 客 户 TCP 进入 FIN_WAIT_2 状态 。 当 处 在 FIN_WAIT_2 状态 时 ， 客 户 等 待 
KK ATR a HY FIN 比特 被 置 为 1 的 男 一 个 报 文 段 ; 当 收 到 该 报 文 段 后 ， 客 户 TCP 对 服务 器 
的 报 文 段 进行 确认 ， 并 进入 TIME_WAIT 状态 假定 ACK HA, TIME_WAIT 状态 使 TCP 
客户 重 传 最 后 的 确认 报 文 。 在 TIME_WAIT 状态 中 所 消耗 的 时 间 是 与 有 具体 实现 有 关 的 ， 而 
典型 的 值 是 30 秒 、1 分 钟 或 2 分 钟 。 经 过 等 竺 后， 连接 就 正式 关闭 ， 客 户 端 所 有 资源 ( 包 
favs) 将 被 释放 - 





SYN 洪涝 攻击 
我 们 在 TCP 三 次 握手 的 讨论 中 已 经 看 到 ， 服务 器 为 了 响应 一 个 收 到 的 SYTN， 分 配 并 
初始 化 连接 变量 和 缓存 ”然后 服务 器 发 送 一 个 SYNACK 进行 响应 ， 并 等 待 来 自 客户 的 
ACK 报 文 段 ”如 果菜 客户 不 发 送 ACK 来 完成 该 三 次 握手 的 第 三 步 ， 最 终 (通常 在 一 分 
多 钟 之 后 ) 服务 器 将 终止 该 半 开 连接 并 回收 资源 ， 
这 种 TCP 连接 管理 协议 为 经 典 的 DoS 攻击 即 SYN 洪江 攻击 (SYN flood attack) 提供 
[His ERAT, Boba Rae A Bas TCP SYN LE, ae 三 次 握手 的 步 
Re. 随 着 这 种 SYN RLR EK k, 服务器 不 断 为 这 些 半 开 连 接 分 配 资 源 (但 从 未 使 
用 ) ， 耳 致 服务 器 的 连接 资源 被 消耗 至 尽 - 这 种 SYN 洪 泛 攻击 是 被 记载 的 众多 DOS 攻击 中 
的 第 一 种 [CERT SYN 1996 ] 。 幸 运 的 是 ， 现 在 有 一 种 有 效 的 防御 系统 ， 称 为 SYN cookie 
[ RFC 4987 ] ， 它 们 被 部 署 在 大 多 数 主 流 操作 系统 中 。SYN cookie 以 下 列 方式 工作 : 
© 当 服 务 器 接收 到 一 个 SYN 报 文 段 时 ， 它 并 不 知道 该 报 文 段 是 来 自 一 个 合法 的 用 
户 ， 还 是 一 个 SYN 洪 泛 攻击 的 一 部 分 。 因 此 服务 器 不 会 为 该 报 文 段 生 成 一 个 半 
开 连 接 。 相反 ， 服 务 器 生成 一 个 初始 TCP 序列 号 ， 该 序列 号 是 SYN 报 文 段 的 源 
和 目的 IP 地 址 与 端口 号 以 及 仅 有 该 服务 器 知道 的 秘密 数 的 一 个 复杂 函数 ( 散 列 
马 数 )、 这 种 精心 制作 的 初始 序列 号 被 称 为 “cookie"”。 服 务 器 则 发 送 具 有 这 种 
特殊 初始 序列 号 的 SYNACK 分 组 、 重 要 的 是 ， 服 务 器 并 不 记忆 该 cookie 或 任何 
对 应 于 SYN 的 其 他 状态 信息 。 

e 如 果 客 户 是 合法 的 ， 则 它 将 返回 一 个 ACK 报 文 段 。 当 服务 器 收 到 该 ACK， 需 要 
验证 该 ACK 是 与 前 面 发 送 的 某 些 SYN 相对 应 的 。 如 果 服 务 器 没有 维护 有 关 SYN 
报 文 段 的 记忆 ， 这 是 怎样 完成 的 呢 ? 正如 你 可 能 猜测 的 那样 ， 它 是 借助 于 
cookie 来 做 到 的 。 前 面 讲 过 对 于 一 个 合法 的 ACK， 在 确认 字段 中 的 值 等 于 在 
SYNACK 字段 (此 时 为 cookie 值 ) 中 的 值 加 1 (参见 图 3-39) 。 服务 器 则 将 使 用 
在 SYNACK 报 文 段 中 的 源 和 目的 地 IP 地 址 与 端口 号 (它们 与 初始 的 SYN 中 的 
相同 ) 以 及 秘密 数 运行 相同 的 散 列 函数 。 如 果 该 函数 的 结果 加 1] 与 在 客户 的 
SYNACK 中 的 确认 (cookie) 值 相 同 的 话 ， 服 务 器 认为 该 ACK 对 应 于 较 早 的 
SYN 报 文 段 ， 因 此 它 是 合法 的 。 服务 器 则 生成 一 个 具有 套 接 字 的 全 开 的 连接 。 
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e 在 另 一 方面 ， 如 果 客 户 没有 返回 一 个 ACK 报 文 段 ， 则 初始 的 SYN 并 没有 对 服务 
器 产生 危害 ， 和 


图 3-42 图 示 了 服务 器 端的 TCP 通常 要 经 历 的 一 系列 状态 ， 其 中 假设 客户 开始 连接 拆 
Ro 这些 状 态 变 迁 是 自 解 释 的 。 在 这 两 个 状态 变迁 图 中 ， 我 们 只 给 出 了 TCP 连接 是 如 何 正 
常 地 被 建立 和 拆除 的 。 我 们 没有 描述 在 某 些 不 正常 的 情况 下 例如 当 连 接 的 双方 同时 部 要 
发 起 或 终止 一 条 连接 时 ) 发 生 的 事情 。 如 果 你 对 此 问题 及 其 他 与 TCP 有 关 的 高 级 问题 感 
兴趣 ， 推 荐 阅读 Stevens 的 内 容 更 全 面 的 书籍 | Stevens 1994 | 。 


服务 器 应 用 程序 创建 
— N 
l 接收 SYN 并 发 送 
发 送 FIN SYN & ACK 
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图 3-42 服务 器 端 TCP 经 历 的 典型 的 TCP 状态 序列 


我 们 上 面 的 讨论 假定 了 客户 和 服务 需 都 准备 通信 ， 即 服务 器 正在 监听 客户 发 送 其 SYN 
报 文 段 的 端口 。 我 们 来 考虑 当 一 台 主 机 接收 到 一 个 TCP 报 文 段 ， 其 端口 号 或 源 IP 地 址 与 
该 主机 上 进行 中 的 套 接 字 都 不 匹配 的 情况 。 例 如 ， 假 如 一 台 主 机 接收 了 具有 目的 端口 80 
的 一 个 TCP SYN 分 组 ， 但 该 主机 在 端口 80 不 接受 连接 ( 即 它 不 在 端口 80 上 运行 Web 服 
务 器 ) 。 则 该 主机 将 向 源 发 送 一 个 特殊 重 置 报 文 段 。 该 TCP 报 文 段 将 RST 标志 位 (参见 
3.5.2 节 ) 置 为 1。 因 此 ， 当 主机 发 送 一 个 重 置 报 文 段 时 ， 它 告诉 该 源 “我 没有 那个 报 文 
段 的 套 接 字 。 请 不 要 再 发 送 该 报 文 段 了 ” 。 当 一 台 主 机 接收 一 个 UDP 分 组 ， 它 的 目的 端口 
与 进行 中 的 UDP 套 接 字 不 匹配 ， 该 主机 发 送 一 个 特殊 的 ICMP 数据 报 ， 这 将 在 第 4 曹 中 
讨论 。 

既然 我 们 已 经 对 TCP 连接 管理 有 了 深入 的 了 解 ， 我 们 再 次 回顾 nmap 端口 扫描 工具 ， 
并 更 为 详细 地 研究 它 的 工作 原理 。 为 了 探索 目标 主机 上 的 一 个 特定 的 TCP 端口 ， 如 端口 
6789, nmap 将 对 那 台 主机 的 目的 端口 6789 发 送 一 个 特殊 的 TCP SYN 报 文 段 。 有 3 种 可 能 
的 输出 : 

e 源 主机 从 目标 主机 接收 到 一 个 TCP SYNACK 报 文 段 。 因 为 这 意味 着 在 目标 主机 上 

一 个 应 用 程序 使 用 TCP 端口 6789 运行 ，nmap 返回 “打开 ”。 
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o 源 主机 从 目标 主机 接收 到 一 个 TCP RST 报 文 段 。 这 意味 着 该 SYN 报 文 段 到 达 了 目 
标 主 机 ， 但 目标 主机 没有 运行 一 个 使 用 TCP 端口 6789 的 应 用 程序 .但 攻击 者 至 少 
ANE Æ EZE HL O 6789 的 报 文 段 没 有 被 源 和 目标 主机 之 间 的 任何 防火 场所 阻 
挡 。( 将 在 第 8 章 中 讨论 防火 墙 ,) 


。 源 什么 也 没有 收 到 。 这 很 可 能 表明 该 SYN 报 文 段 被 中 间 的 防火 墙 所 阻挡 ， 无 法 到 
达 目 标 主机 ， 


nmap 是 一 个 功能 强大 的 工具 ， 该 工具 不 仅 能 “侦察 ”打开 的 TCP wH, tAE “wi 
察 ” 打 开 的 UDP 端口 ， 还 能 “侦察 ”防火 墙 及 其 配置 ， 甚 至 能 “侦察 ”应 用 程序 的 版 本 
和 操作 系统 。 其 中 的 大 多 数 部 能 通过 操作 TCP 连接 管理 报 文 段 完成 [Skoudis 2006 ] 。 读 者 
能 够 从 http -// WWW. nmap. org FR nmap - 

到 此 ， 我 们 介绍 完了 TCP 中 的 差错 控制 和 流量 控制 。 在 3.7 市 中 ， 我 们 将 回 到 TCP 并 
更 深入 地 研究 TCP 拥塞 控制 问题 。 然 而 ， 在 此 之 前 ， 我 们 先后 退 一 步 ， 在 更 广泛 环境 中 讨 
论 拥塞 控制 问题 。 


3.6 拥塞 控制 原理 


在 前 面 几 节 中 ， 我 们 已 经 分 析 了 面临 分 组 丢失 时 用 于 提供 可 靠 数 据 传输 服务 的 基本 原 
理 及 特定 的 TCP 机 制 。 我 们 以 前 讲 过 ， 在 实践 中 ， 这 种 丢 包 一 般 是 当 网 络 变 得 拥塞 时 由 于 
路 由 需 缓 存 汶 出 引起 的 。 分 组 重 传 因 此 作为 网 络 拥塞 的 征兆 〈 某 个 特定 的 运输 层 报 文 段 的 
ER) 来 对 待 ， 但 是 却 无 法 处 理 导 致 网络 拥 赛 的 原因 ， 因 为 有 太 多 的 源 想 以 过 高 的 速率 发 
送 数据 。 为 了 处 理 网 络 拥 赛 原 因 ， 和 需要 一 些 机 制 以 在 面临 网 络 拥塞 时 遇 制 发 送 方 。 

在 本 节 中 ， 我 们 考虑 一 般 情 况 下 的 拥塞 控制 问题 ， 试 图 理解 为 什么 网 络 拥塞 是 一 件 坏 
事情 ， 网 络 拥 塞 是 如 何在 上 层 应 用 得 到 的 服务 性 能 中 明确 地 显露 出 来 的 ?如 何 可 用 各 种 方 
法 来 避免 网 络 拥 寨 或 对 它 作 出 反应 ”这 种 对 拥塞 控制 的 更 一 般 研 究 是 恰当 的 ， 因 为 就 像 可 
徘 数据 传输 一 样 ， 它 在 组 网 技术 中 的 前 10 个 基础 性 重要 问题 清单 中 位 居 前 列 。 我 们 通过 
对 异步 传递 方式 (ATM) 网 络 中 可 用 比特 率 (ABR) 服务 中 的 拥塞 控制 的 讨论 来 总 结 本 
节 。 下 面 一 节 包 含 了 TCP 的 拥塞 控制 算法 的 详细 研究 。 


3. 6. 1 拥塞 原因 与 代价 


我 们 通过 分 析 3 个 复杂 性 越 来 越 高 的 发 生 拥 塞 的 情况 ， 开 始 对 拥塞 控制 的 一 般 性 研 
究 。 在 每 种 情况 下 ， 我 们 首先 将 看 看 出 现 拥 塞 的 原因 以 及 拥塞 的 代价 〈 根 据 资 源 未 被 充分 
利用 以 及 端 系 统 得 到 的 低劣 服务 性 能 来 评价 ) 。 我 们 暂 不 关注 如 何 对 拥堵 作出 反应 或 避 人 钢 
拥塞 ， 而 是 重点 理解 一 个 较为 简单 的 问题 ， 即 随 着 主机 增加 其 发 送 速率 并 使 网 络 变 得 拆 
塞 ， 这 时 会 发 生 的 情况 .。 

1. 情况 1: 两 个 发 送 方 和 一 台 有 具有 无 穷 大 缓存 的 路 由 此 

我 们 先 考 虑 也 许 是 最 简单 的 拥塞 情况 : 两 台 主 机 (A 和 B) 都 有 一 条 连接 ， 且 这 两 条 
连接 共享 源 与 目的 地 之 间 的 单 跳 路 由 ， 如 图 3-43 所 示 。 

我 们 假设 主机 A 中 的 应 用 程序 以 A,, 字 节 / 秒 的 平均 速率 将 数据 发 送 到 连接 中 (例如 ， 
通过 一 个 套 接 字 将 数据 传递 给 运输 层 协议 )。 这 些 数据 是 初始 数据 ， 这 意味 看 每 个 数据 单 
元 仅 向 套 接 字 中 发 送 一 次 。 下 面 的 运输 层 协 议 是 一 个 人 简单 的 协议 。 数 据 被 封装 并 发 送 ; 不 
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执行 差错 恢复 (如 重 传 ) 、 流 量 控制 或 拥塞 控制 。 忽 略 由 于 添加 运输 层 和 较 低 层 首 部 信息 
产生 的 额外 开销 ， 在 第 一 种 情况 下 ， 主 机 A 回路 由 需 提 供 流 量 的 速率 是 A,, 字 市 / 秒 。 主 机 
B 也 以 同样 的 方式 运行 ， 为 了 简化 问题 ， 我 们 假设 它 也 是 以 速率 A, 字 节 / 秒 发 送 数 据 。 来 
自主 机 A 和 主机 B 的 分 组 通过 一 台 路 由 器 ， 在 一 段 容 量 为 尺 的 共享 式 输出 链 路 上 传输 - 
六 路 由 融 带 有 缓存 ， 可 用 于 当 分 组 到 达 速 率 超 过 该 输出 链 路 的 容量 时 存储 “和 人 分组”。 在 
此 第 一 种 情况 下 ， 我 们 将 假设 路 由 硕 有 无 限 大 的 绥 存 空间 : 


An’ 初始 数据 Aout 
主机 A | > 主机 B 主机 C 


Fs 





输出 链 路 缓存 
图 3-43 拥塞 情况 1: 两 条 连接 共享 具有 无 限 大 缓存 的 单 跳 路 由 


图 3-44 描绘 出 了 第 一 种 情况 下 主机 A 的 连接 性 能 。 左 边 的 图 形 摘 绘 了 每 连接 的 吞吐 
量 (per-connection throughput) (接收 方 每 秒 接收 的 宇 市 数 ) 与 该 连接 发 送 速率 之 间 的 图 
数 关系 。 当 发 送 速率 在 0 ~ R/2 之 间 时 ， 接收 方 的 吞吐 量 等 于 发 送 方 的 发 送 速率 ， 即 发 送 
方 发 送 的 所 有 数据 经 有 限时 延 后 到 达 接 收 方 。 然 而 当 发 送 速率 超过 RA2 i, CAEH 
能 达 RX2.。 这 个 吞吐 量 上 限 是 由 两 条 连接 之 间 共 享 链 路 容量 造成 的 。 链 路 完全 不 能 以 超过 
R/2 的 稳定 状态 速率 向 接收 方 交 付 分 组 。 无 论 主机 A 和 主机 B 将 其 发 送 速率 设置 为 多 高 ， 
它们 都 不 会 看 到 超过 R/2 AY Fr ae. 





R/2 


a) b) 
图 3-44 拥塞 情况 1: Feith ee PRES EAL HK A 


取得 每 连接 R/2 的 吞吐 量 实际 上 看 起 来 可 能 是 件 好 事 ， 因 为 在 将 分 组 交付 到 目的 地 的 
过 程 中 链 路 被 充分 利用 了 了。 但是， 图 3-44b 的 图 形 却 显示 了 以 接近 链 路 容量 的 速率 运行 时 
产生 的 后 果 。 当 发 送 速率 接近 R/2 IN ( 从 左 至 右 ) ， 平 均 时 延 就 会 越 来 越 大 。 当 发 送 速 率 
超过 R/2 时 ， 路 由 器 中 的 平均 排队 分 组 数 就 会 无 限 增长 ， 源 与 目的 地 之 间 的 平均 时 延 也 会 
变 成 无 穷 大 (假设 这 些 连 接 以 此 发 送 速率 运行 无 限 长 时 间 并 且 有 无 限量 的 缓存 可 用 )。 
因此 ， 虽然 从 否 吐 量 角度 看 ， 运 行 在 总 否 吐 量 接近 R 的 状态 也 许 是 一 个 理想 状态 ,但 从 
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时 延 角 度 看 ， 却 远 不 是 一 个 理想 状态 。 甚 至 在 这 种 (极端 ) 理想 化 的 情况 中 ,我 们 已 
经 发 现 了 拥塞 网 络 的 一 种 代价 ， 即 当 分 组 的 到 达 束 率 接 近 链 路 容量 时 ， 分 组 经 历 巨 大 的 
排队 时 延 ， 

2. 情况 2: 两 个 发 送 方 和 一 台 有 具有 有 限 缓存 的 路 由 虎 

现在 我 们 从 下 列 两 个 方面 对 情况 1 稍微 做 一 些 修改 〈 参 见 图 3-45)。 首 先 ， 假 定 路 由 
需 缓存 的 容量 是 有 限 的 。 这 种 现实 世界 的 假设 的 结果 是 ， 当 分 组 到 达 一 个 已 满 的 缓存 时 会 
被 玉 弃 。 其 次 ， 我 们 假定 每 条 连接 都 是 可 靠 的 ，。， 如 果 一 个 包含 有 运输 层 报 文 段 的 分 组 在 路 
由 器 中 被 丢弃 ， 那 么 它 终 将 被 发 送 方 重 传 。 由 于 分 组 可 以 被 重 传 ， 所 以 我 们 现在 必须 更 小 
心地 使 用 发 送 速 率 这 个 术语 。 特 别 是 我 们 再 次 以 A, 字 节 /秒表 示 应 用 程序 将 初始 数据 发 送 
到 套 接 字 中 的 速率 。 运输 层 回 网 络 中 发 送 报 文 段 (含有 初始 数据 或 重 传 数据 ) 的 速率 用 
A' 字 节 / 秒 表示 。A' 有 时 被 称 为 网 络 的 供给 载 集 (offered load) 。 


A... 初始 数据 
Al: 初始 数据 加 重 传 数 据 
主机 A © MB | 
| x nes 
\ = a ae 
w {1 





有 限 的 共享 
输出 链 路 缓存 


图 3-45 情况 2: (有 重 传 的 ) 两 台 主 机 与 一 台 拥 有 有 限 缓存 的 路 由 带 


在 情况 2 下 实现 的 性 能 将 完全 取决 于 重 传 的 方式 。 首 先 ， 考 虑 一 种 不 真实 的 情况 ， 即 
主机 A 能 够 以 某 种 方式 (不 可 思议 地 !) 确定 路 由 带 中 的 缓存 是 否 空 ， 因 而 仅 当 缓存 空 
闲 时 才 发 送 一 个 分 组 。 在 这 种 情况 下 ， 将 不 会 产生 丢 包 ，A;, 与 Ai, 相等， 并 且 连 接 的 在 吐 
量 就 等 于 A;,。 图 3-46a 中 描述 了 这 种 情况 。 从 吞吐 量 的 角度 看 ， 性 能 是 理想 的 ， 即 发 送 的 
每 个 分 组 都 被 接收 到 。 注 意 到 在 这 种 情况 下 ， 平 均 主 机 发 送 速率 不 能 超过 RA2， 因 为 假定 
不 会 发 生 分 组 丢失 。 

接 下 来 考虑 一 种 更 为 真实 的 情况 ， 发 送 方 仅 当 在 确定 了 一 个 分 组 已 经 丢失 时 才 重 传 。 
( 同样， 所 做 的 假设 有 一 些 弹性 。 然 而 ， 发 送 主机 有 可 能 将 超时 时 间 设 置 得 足够 长 ， 以 无 
形 中 使 其 确信 一 个 还 没有 被 确认 的 分 组 已 经 丢失 -) 在 这 种 情况 下 ， 人 性 能 就 可 能 与 图 3-46b 
所 示 的 情况 相似 。 为 了 理解 这 时 发 生 的 情况 ， 考 虑 一 下 供给 载荷 A (初始 数据 传输 加 上 
重 传 的 总 速率 ) 等 于 R/2 的 情况 。 根 据 图 3-46b， 在 这 一 供给 载荷 值 时 ， 数 据 被 交付 给 接 
收 方 应 用 程序 的 速率 是 RA3。 因 此 ， 在 所 发 送 的 0.5R 单位 数据 当中 ， 从 平均 的 角度 说 ， 
0. 333R 字 节 / 秒 是 初始 数据 ， 而 0. 166R 字 节 / 秒 是 重 传 数 据 。 我 们 在 此 看 到 了 另 一 种 网 络 
拥塞 的 代价 ， 即 发 送 方 必须 执行 重 传 以 补偿 因为 缓存 溢出 而 丢弃 (丢失 ) 的 分 组 。 

最 后 ， 我 们 考虑 下 面 一 种 情况 : 发 送 方 也许 会 提前 发 生 超时 并 重 传 在 队列 中 已 被 推 返 
但 还 未 丢失 的 分 组 。 在 这 种 情况 下 ， 初 始 数据 分 组 和 重 传 分 组 都 可 能 到 达 接 收 方 。 当 然 ， 
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接收 方 只 需要 一 份 这 样 的 分 组 副本 就 行 了 , PS PEE. FERAL F, h ae 
发 重 传 的 初始 分 组 副本 是 在 做 无 用 功 ， 因 为 接收 方 已 收 到 了 该 分 组 的 初始 版 本 。 而 路 由 条 
本 可 以 利用 链 路 的 传输 能 力 去 发 送 另 一 个 分 组 。 这里， 我 们 又 看 到 了 网 络 拥 塞 的 另 一 种 代 
价 ， 即 发 送 方 在 遇 到 大 时 延 时 所 进行 的 不 必要 重 传 会 引起 路 由 器 利用 其 链 路 带宽 来 转发 不 
必要 的 分 组 副本 。 图 3-46c 显示 了 当 假 定 每 个 分 组 被 路 由 硕 转 发 (平均 ) PARKIN, AP ithe 
与 供给 载荷 的 对 比 情况 。 由 于 每 个 分 组 被 转发 两 次 ， 当 其 供给 载 位 接近 R/2 OY, AAP ih 
将 渐 近 R/4。 





f Ain m 
a) b) c) 
图 3-46 有 具有 有 限 缓存 时 情况 2 的 性 能 


3. 情况 3: 4 个 发 送 方 和 具有 有 限 缓存 的 多 台 路 由 器 及 多 跳 路 径 
在 最 后 一 种 拥塞 情况 中 ， 有 4 台 主 机 发 送 分 组 ， 每 台 都 通过 交合 的 两 跳 路 径 传输 ， 如 
图 3-47 所 示 。 我 们 再 次 假设 每 台 主机 都 采用 超时 / 重 传 机 制 来 实现 可 靠 数据 传输 服务 ， 所 
有 的 主机 都 有 相同 的 A, 值 ， 所 有 路 由 咒 的 链 路 容量 都 是 尺 字 他 / 秒 。 
Ag? 初始 数据 
hv: 初始 数据 加 重 传 数据 hu 
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图 3-47 ”四 个 发 送 方 和 具有 有 限 缓存 的 多 合 路 由 需 及 多 跳 路 径 
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我 们 考虑 从 主机 A 到 主机 C HE, AEA s RI 和 R2, A -C 连接 与 D - 
B 连接 共享 路 由 器 R1， 并 与 B -DD ERE RA AR R2。 对 极 小 的 ALTA, h AET lit 
HERA (SAWER, PASE pA), Tia KERER R. MAH 
大 的 和 A, 值 ， 对 应 的 否 吐 量 也 更 大 ， 因 为 有 更 多 的 初始 数据 被 发 送 到 网 络 中 并 交付 到 目的 
地 ,溢出 仍然 很 少 。 因 此 ， 对 于 较 小 的 A, ，A; 的 增 大 会 导致 A,, 的 增 大 ， 

在 考虑 了 流量 很 小 的 情况 后 ， 下 面 分 析 当 A, CAL) 很 大 时 的 情况 .考虑 路 由 需 
R2, WE A, AEA, BAR HH AR R2 的 A -C 流量 (在 经 过 路 由 融 Rl 转发 后 到 达 路 
Hat R2) 的 到 达 速 率 至 多 是 尺 ， 也 就 是 从 RI 到 R2 的 链 路 容量 ， 如果 ,对 于 所 有 连接 
(包括 B-D 连 接 ) 来 说 是 极 大 的 值 ， 那 么 在 R2 上 ，B -D 流量 的 到 达 速 率 可 能 会 比 A -C 
流量 的 到 达 速 率 大 得 多 。 因 为 A -C 流量 与 B-D 流量 在 路 由 郑 R2 上 必须 为 有 限 缓存 空间 
而 竞争 ， 所 以 当 来 自 B-D 连接 的 供给 载荷 越 来 
越 大 时 ，A -C 连接 上 成 功 通过 R2 ( 即 由 于 缓存 
溢出 而 未 被 丢失 ) 的 流量 会 越 来 越 小 。 在 极限 
情况 下 ， 当 供给 载荷 趋 近 于 无 穷 大 时 ，R2 BE 
闲 缓存 会 立即 被 B - D 连接 的 分 组 占 满 ， 因 而 ~ 
A -(C 连 接 在 R2 上 的 吞吐 量 趋 近 于 0。 这 又 一 次 
说 明 在 重 载 的 极限 情况 下 ，A - C 端 到 端 吞吐 量 
将 趋 近 于 0. 这 些 考虑 引发 了 供给 载荷 与 吞吐 量 


R/2 


之 间 的 权衡 ， 如 图 3-48 所 示 。 A 
4 75 EH 28 BY Ys Bee TE AY, Bf 图 3-48 县 有 有 限 缓存 和 多 跳 
着 供给 载荷 的 增加 而 使 乔 吐 量 最 终 减 少 的 原因 是 路 答 时 的 情况 3 性 能 


明显 的 。 在 上 面 提 到 的 大 流量 的 情况 中 ， 每 汝 有 一 个 分 组 在 第 二 跳 路 由 带 上 被 丢弃 时 ， 第 
一 跳 路 由 器 所 做 的 将 分 组 转发 到 第 二 跳 路 由 需 的 工作 就 是 “和 劳 而 无 功 ” 的 。 如 果 第 一 跳 路 
由 兰 只 是 琅 弃 该 分 组 并 保持 空 亲 ， 则 网 络 中 的 情况 是 幸运 的 〈 更 准确 地 说 是 糟糕 的 ) 。 震 
要 指出 的 是 ， 第 一 跳 路 由 需 所 使 用 的 将 分 组 转发 到 第 二 跳 路 由 需 的 传输 容量 用 来 传送 不 同 
的 分 组 可 能 更 有 效益 。( 例 如 ， 当 选择 一 个 分 组 发 送 时 ， 路 由 需 最 好 优先 考虑 那些 已 经 历 
过 一 定数 量 的 上 游 路 由 需 的 分 组 -) 所 以 ， 我 们 在 此 又 看 到 了 由 于 拥塞 而 丢弃 分 组 的 另 一 
种 代价 ， 即 当 一 个 分 组 沿 一 条 路 径 被 丢弃 时 ， 每 个 上 游 路 由 器 用 于 转发 该 分 组 到 丢弃 该 分 
组 而 使 用 的 传输 容量 最 终 被 浪费 掉 了 。 


3.6.2 拥塞 控制 方法 


在 3.7 节 中 ,我 们 将 详细 研究 TCP 用 于 拥塞 控制 的 特定 方法 。 这 里 ， 我 们 指出 在 实践 
中 所 采用 的 两 种 主要 拥塞 控制 方法 ， 讨 论 特 定 的 网 络 体系 结构 和 具体 使 用 这 些 方法 的 拥塞 
控制 协议 。 
在 最 为 宽泛 的 级 别 上 ， 我们 可 根据 网 络 层 是 否 为 运输 层 拥塞 控制 提供 了 显 式 帮助 ， 来 
区 分 拥塞 控制 方法 。 
e 端 到 端 拥塞 控制 。 在 端 到 端 拥塞 控制 方法 中 ， 网 络 层 没有 为 运输 层 拥 塞 控制 提供 
显 式 支持 。 即 使 网 络 中 存在 拥塞 ， 端 系统 也 必须 通过 对 网 络 行为 的 观察 (如 分 组 
丢失 与 时 延 ) 来 推 亲 之。 我 们 将 在 3.7 节 中 将 看 到 ，TCP 必须 通过 端 到 问 的 方法 
解决 拥 寨 控制 ， 因 为 IP 层 不 会 向 端 系统 提供 有 关 网 络 拥 塞 的 反馈 信息 。TCP 报 文 
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BIER (通过 超时 或 3 次 见 余 确认 而 得 知 ) 被 认为 是 网 络 拥塞 的 一 个 迹象 ， 
TCP 会 相应 地 减 小 其 窗口 长 度 。 我 们 还 将 看 到 关于 TCP 拥塞 控制 的 一 些 最 新 建议 ， 
即使 用 增加 的 往返 时 延 值 作为 网 络 拥塞 程度 增加 的 指示 。 

e 网 络 辅助 的 拥塞 控制 .在 网 络 辅助 的 拥塞 控制 中 ， 网 络 层 构件 〈 即 路 由 需 ) 回 发 

送 方 提供 关于 网 络 中 拥塞 状态 的 显 式 反馈 信息 。 这 种 反馈 可 以 简单 地 用 一 个 比特 
来 指示 链 路 中 的 拥 禾 情况 . 该 方法 在 早期 的 1 IBM SNA | Schwartz 1982 | 和 DEC 
DECnet | Jain 1989; Ramakrishnan 1990 | 等 体系 结构 中 被 采用 ， 近 来 被 建议 用 于 
TCP/IP 网 络 | Floyd TCP 1994; RFC 3168 ] ， 而 且 还 用 在 我 们 下 面 要 讨论 的 ATM 
可 用 比特 率 (ABR) 拥塞 控制 中 。 更 复杂 的 网 络 反 馈 也 是 可 能 的 。 人 例如， 我 们 很 
快 将 学 习 的 一 种 ATM ABR 拥塞 控制 形式 ， 它 允许 路 由 郑 显 式 地 通知 发 送 方 ， 告 知 
È (HEH) BE CET HE E XIE EK. KFN Hs BLAS LR RAL AE 
速率 ，XCP 协议 [Katabi 2002 | 对 每 个 源 提供 了 路 由 需 计 算 的 反 饿 ， 该 反馈 携 市 
在 分 组 首部 中 。 

对 于 网 络 辅助 的 拥塞 控制 ， 拥 赛 信 息 从 网 络 反馈 到 发 送 方 通 负 有 两 种 方式 ， 如 网 3-49 
所 示 。 直 接 反馈 信息 可 以 由 网 络 路 由 需 发 给 发 送 方 。 这 种 方式 的 通知 通 币 采用 了 一 种 阻塞 
分 组 (choke packet) 的 形式 〈 主 要 是 说 :“ 我 拥 赛 了 ! ”)。 第 二 种 形式 的 通知 是 ， 路 由 需 
标记 或 更 新 从 发 送 方 流 回 接收 方 的 分 组 中 的 某 个 字段 来 指示 拥塞 的 产生 。 一 旦 收 到 一 个 标 
沁 的 分 组 后 ， 接 收 方 就 会 向 发 送 方 通 知 该 网 络 拥塞 指示 。 注 意 到 后 一 种 形式 的 通知 至 少 要 
经 过 一 个 完整 的 往返 时 间 。 

主机 A 
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图 3-49 ”网络 指示 拥塞 信息 的 两 种 反馈 路 径 
3.6.3 网 络 辅助 的 拥塞 控制 例子 : ATM ABR 拥塞 控制 


我 们 现在 通过 一 个 简要 的 学 习 案 例 来 结束 本 节 ， 该 案例 是 ATM ABR 中 的 拥塞 控制 算 
法 ， 即 一 种 采用 网 络 辅助 方法 解决 拥塞 控制 的 协议 。 我 们 强调 此 时 的 目的 不 是 详细 地 描述 
ATM 体系 结构 的 方方面面 ， 而 只 是 为 了 说 明 该 协议 为 拥塞 控制 所 采用 的 方法 明显 不 同 于 
因特网 TCP 协议 的 方法 。 事 实 上 ， 我们 下 面 仅 给 出 为 了 理解 ABR 拥塞 控制 所 需要 的 ATM 
体系 结构 的 几 个 方面 。 

ATM 基本 上 采用 一 种 面向 虚 电 路 (VC) 的 方法 来 处 理 分 组 交换 。 回 想 我 们 在 第 1 革 中 
的 讨论 ， 这 意味 着 从 源 到 目的 地 路 径 上 的 每 台 交 换 机 将 维护 有 关 源 到 目的 地 VC 的 状态 。 这 
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种 逐个 VC WA (例如 ， Bie ENE Pea) 
并 采取 特定 源 的 拥塞 控制 动作 CARA, “ACHR LARTER, [ny Ace Fr Ae Gb sa OW ik 
的 速率 ) 。 网 络 交 换 机 上 的 这 种 逐 VC 状态 使 ATM 非常 适合 执行 网 络 辅助 拥 寺 控制 。 

ABR 已 被 设计 成 一 种 弹性 数据 传输 服务 ， 该 服务 方式 使 人 联想 起 TCP. 当 网 络 轻 载 
时 ，ABR 服务 会 充分 利用 空 闪 的 可 用 带宽 ; 当 网 络 拥 寨 时 ，ABR 服务 会 将 其 传输 速率 抑 
制 为 某 些 预先 确定 的 最 小 传输 速率 。[ Jain 1996] 提供 了 一 个 关于 ATM ABR 拥塞 控制 与 流 
量 管理 的 详细 学 习 指南 。 

图 3-50 显示 了 ATM ABR 拥塞 控制 框架 。 在 下 面 的 讨论 中 ,我们 将 采用 ATM 的 术语 
(如 使 用 术语 交换 机 而 不 使 用 路 由 器 ; 使 用 术语 信 元 (cell) 而 不 使 用 分 组 )。 对 于 ATM 
ABR 服务 ， 数 据 信 元 从 源 经 过 一 系列 中 间 交 换 机 传输 到 目的 地 . 在 数据 信 匹 中 夹杂 着 所 请 
的 资源 管理 信 元 (Resource-Management cell, RM 信 元 ) ;， 这些 RM 信和 元 可 被 用 来 在 主机 和 
交换 机 之 间 传 递 与 拥塞 相关 的 信息 。 当 一 个 RM 信 元 到 达 目 的 地 时 ， 它 将 被 掉 转 方 回 并 回 
发 送 方 发 送 (很 可 能 是 在 目的 地 修改 了 该 RM (CMA A Za). 。 交换 机 也 有 可 能 目 己 产 
生 一 个 RM 信 元 ， 并 将 该 RM 信 元 直接 发 送 给 源 ， 因 此 ，RM 信 元 可 用 来 提供 直接 网 络 反 
馈 和 经 由 接收 方 的 网 络 反 馈 ， 如 图 3-50 Pitan. 

目的 地 





图 例 : 
Arm A 数据 信 元 


图 3-50 用 于 ATM ABR 服务 的 拥塞 控制 框架 


ATM ABR 拥塞 控制 是 一 种 基于 速率 的 方法 。 即 发 送 方 明 确 地 计算 出 它 所 能 发 送 的 最 
KEK, 并 据 此 对 自己 进行 相应 的 调整 。ABR 提供 三 种 机 制 用 于 从 交换 机 回 接收 方 发 送 与 
拥塞 相关 的 信 令 信息 

e EFCI 比特 . a 个 数据 信 元 都 包含 1 比特 的 显 式 转发 拥塞 指示 (Explicit Forward 

Congestion Indication, EFCI) 比特 。 某 拥塞 的 网 络 交 换 机 可 把 一 个 数据 信 元 中 的 
EFCI 比特 设置 为 1 来 回 目 的 主机 发 送 网 络 已 经 拥塞 的 信 令 。 其 目的 地 必须 检查 所 
有 收 到 的 数据 信 元 中 的 EFCI 比特 。 当 一 个 RM 信 元 到 达 目 的 地 时 ， 如 宁 多 数 近 来 
收 到 的 数据 信 元 的 EFCI 比特 都 被 置 为 1， 则 目的 地 就 会 将 RM AIE ta as EL 
特 (CI 比特) 置 为 1， 并 将 该 RM 信 无 发 送 回 发 送 方 。 使 用 数据 信 元 中 的 EFCI 比 
特 和 RM 信 元 中 的 CI 比特 ， 发 送 方 因而 能 在 网 络 交换 机 拥塞 时 得 到 通知 . 

e Cl fo NI 比特。 如 上 所 述 ， 发 送 方 到 接收 方 的 RM 信 元 是 夹杂 在 数据 单元 当中 的 。 
RM 信和 元 的 夹杂 比率 是 一 个 可 调 参 数 ， 默 认 值 是 每 32 个 数据 信 元 中 有 一 个 RM 信 
元 。 这 些 RM 信 元 中 有 一 个 拥塞 指示 (Congestion Indication, Cl) 比特 和 无 增长 
(No Increase, NI) 比特 ， 这 两 个 比特 可 被 一 台 拥塞 的 交换 机 设置 。 特别 是 ， 交 换 
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机 可 以 在 轻微 拥塞 时 将 经 过 的 RM 信 元 中 的 NI EPR A 1, ARW, FE CI 
比特 置 为 1。 当 目的 主机 收 到 一 个 RM fact, ERE RM 信和 元 发 回 给 发 送 方 ， 
而 保持 CI 与 NI 比特 不 变 (除了 CI 比特 也 许 会 因为 上 和 面 描述 的 EFCI 机 制 而 由 目 
的 闹 置 为 1 之 外 )。 
e ER 的 设置 ,每 一 个 RM 信和 元 还 包含 一 个 两 宇 市 的 显 式 速 率 (Explicit Rate, ER) 
字段 。 一 个 拥塞 的 交换 机 也 许 会 降低 经 过 的 RM 信和 元 中 ER 字段 所 包含 的 但 。 以 这 
种 方式 ，ER 字段 将 被 设置 为 在 源 至 目的 地 的 路 径 上 的 所 有 交换 机 中 的 最 小 可 支持 
一 个 ATM ABR 源 以 返回 的 RM 信 元 中 的 CIL、NI 及 ER 人 为 图 数 ， 来 调整 其 发 送信 元 
的 速率 。 进 行 速率 调整 的 规则 非常 复杂 而 且 繁 琐 ， 感 兴趣 的 读者 可 以 参考 | Jain 1996] 以 
得 到 详细 信息 。 


3.7 TCP 拥塞 控制 


在 本 节 中 ， 我 们 再 次 来 学 习 TCP。， 如 我 们 在 3. 5 节 所 见 ，TCP 为 运行 在 不 同 主机 上 的 
两 个 进程 之 间 提 供 了 可 靠 传 输 服 务 。TCP 的 另 一 个 关键 部 分 就 是 其 拥塞 控制 机 制 ， 如 在 前 
一 节 所 指出 ，TCP 必须 使 用 端 到 端 拥 塞 控制 而 不 是 使 网 络 辅助 的 拥塞 控制 ， 因 为 IP 层 不 
各 端 系统 提供 显 式 的 网 络 拥 窒 反馈 。 

TCP 所 采用 的 方法 是 让 每 一 个 发 送 方 根据 所 感知 到 的 网 络 拥塞 程度 来 限制 其 能 同 连 接 
发 送 流量 的 速率 。 如 果 一 个 TCP 发 送 方 感知 从 它 到 目的 地 之 间 的 路 径 上 没什么 拥塞 ， 则 
TCP 发 送 方 增加 其 发 送 速率 ; 如 果 发 送 方 感知 沿 着 该 路 径 有 拥塞 ， 则 发 送 方 就 会 降低 其 发 
送 速率 。 但 是 这 种 方法 提出 了 三 个 问题 。 第 一 ， 一 个 TCP 发 送 方 如 何 限制 它 回 其 连接 发 送 
流量 的 速率 呢 ? 第 二 ， 一 个 TCP 发 送 方 如 何 感知 从 它 到 目的 地 之 间 的 路 径 上 存在 拥 窟 呢 ? 
第 三 ， 当 发 送 方 感知 到 端 到 端的 拥 蹇 时 ， 采 用 何 种 算法 来 改变 其 发 送 速 率 呢 ? 

我 们 首先 分 析 一 下 TCP 发 送 方 是 如 何 限制 加 其 连接 发 送 流 量 的 。 在 3.5 天 中 我 们 看 
到 ，TCP 连接 的 每 一 病 都 是 由 一 个 接收 缓存 、 一 个 发 送 缓 仔 和 几 个 变量 (LastByteRead , 
rwnd 等 ) 组 成 。 运 行 在 发 送 方 的 TCP 拥塞 控制 机 制 跟 蹊 一 个 额外 的 变量 ， 即 拥塞 窗口 
(congestion window ) 。 拥 塞 窗口 表示 为 cwnd， 它 对 一 个 TCP 发送 方 能 向 网 络 中 发 送 流 量 的 
速率 进行 了 限制 。 特 别 是 ， 在 一 个 发 送 方 中 未 被 确认 的 数据 量 不 会 超过 cwnd 与 rwnd 中 的 
FMA, BP 

LastByteSent - LastByteAcked Smin |cwnd, rwnd} 

为 了 关注 拥塞 控制 (与 流量 控制 形成 对 比 )， 我 们 后 面 假设 TCP 接收 缓存 足够 大 ， 以 
至 可 以 忽略 接收 窗口 的 限制 ; 因此 在 发 送 方 中 未 被 确认 的 数据 量 仅 受 限 于 cwnd。 我 们 还 
假设 发 送 方 总 是 有 数据 要 发 送 ， 即 在 拥塞 窗口 中 的 所 有 报 文 段 要 被 发 送 。 

上 上面 的 约束 限制 了 发 送 方 中 未 被 确认 的 数据 量 ， 因 此 间接 地 限制 了 发 送 方 的 发 送 速率 
为 了 理解 这 一 点 ， 我 们 来 考虑 一 个 丢 包 和 发 送 时 延 均 可 以 忽略 不 计 的 连接 。 因 此 粗略 地 讲 ， 
在 每 个 往返 时 间 (RTT) 的 起 始点 ， 上 面 的 限制 条 件 允 许 发 送 方 回 该 连接 发 送 cwd PSF 
的 数据 ， 在 该 RTT 结束 时 发 送 方 接收 对 数据 的 确认 报 文 。 因 此 ， 该 发 送 方 的 发 送 速率 大 概 是 
ewnd/RTT 字 节 / 秒 。 通 过 调节 cwnd 的 值 ， 发 送 方 因此 能 调整 它 向 连接 发 送 数据 的 速率 - 

我 们 接 下 来 考虑 TCP 发 送 方 是 如 何 感知 在 它 与 目的 地 之 间 的 路 径 上 出 现 了 拥塞 的 .我 
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们 将 一 个 TCP 发 送 方 的 “ 丢 包 事件 ”定义 为 : 要 么 出 现 超 时 ， 要 么 收 到 来 和 目 接 收 方 的 3 
NICR ACK, (回想 我 们 在 3.5.4 节 有 关 图 3-33 中 的 超时 事件 的 讨论 和 收 到 3 个 元 余 ACK 
后 包括 快速 重 传 的 后 继 修 改 。) 当 出 现 过 度 的 拥塞 时 ， 在 沿 着 这 条 路 从 上 的 一 台 (或 多 
台 ) 路 由 天 的 缓存 会 汶 出 ， 引 起 一 个 数据 报 (包含 一 个 TCP 报 文 段 ) REF, EFA 
据 报 接着 会 引起 发 送 方 的 丢 包 事件 (要么 超时 或 收 到 3 NITE ACK) ， 发 送 方 就 认为 在 发 
送 方 到 接收 方 的 路 径 上 出 现 了 拥塞 的 指示 。 
考虑 了 拥塞 检测 问题 后 ， 我 们 接 下 来 考虑 网 络 没有 拥塞 这 种 更 为 乐观 的 情况 ， 即 没有 
出 现 丢 包 事 件 的 情况 。 在 此 情况 下 ,在 TCP 的 发 送 方 将 收 到 对 于 以 前 未 确认 报 文 段 的 确 
认 。 如 我 们 将 看 到 的 那样 ，TCP 将 这 些 确认 的 到 达 作 为 一 切 正常 的 指示 ， 即 在 网 络 上 传输 
的 报 文 段 正 被 成 功 地 交付 给 目的 地 ， 并 使 用 确认 来 增加 窗口 的 长 度 (及 其 传输 速率 ) 。 注 
意 到 如 果 确 认 以 相当 慢 的 速率 到 达 (例如 ， 如 果 该 端 到 端 路 径 具 有 高 时 延 或 包含 一 段 低 于 
WHM), ， 则 该 拥塞 窗口 将 以 相当 慢 的 速率 增加 。 在 另 一 方面 ， 如 果 确 认 以 高 速率 到 达 ， 
则 该 拥 窟 窗口 将 会 更 为 迅速 地 增 大 。 因 为 TCP 使 用 确认 来 触发 (或 计时 ) HEE AE 
窗口 长 度 ，TCP 被 说 成 是 自 计 时 (self-clocking) 的 。 
给 定 调节 cwnd 值 以 控制 发 送 速率 的 机 制 ， 关 键 的 问题 依然 存在 : TCP 发 送 方 怎样 确 
定 它 应 当 发 送 的 速率 呢 ? 如 果 众 多 TCP 发 送 方 总 体 上 发 送 太 快 ， 它 们 能 够 拥塞 网 络 ， 导 致 
我 们 在 图 3-48 中 看 到 的 拥塞 朋 演 。 事 实 上 ， 为 了 应 对 在 较 早 TCP 版 本 下 观察 到 的 因特网 
HÆ [Jacobson 1988 ] ， 研 发 了 该 版 本 的 TCP (我们 马上 将 学 习 它 )。 然 而 ， 如 果 TCP 
KRISTI TRI, AGRA, EM ABE SCOALA A ir Ge; 这 就 是 说 ，TCP 发 送 方 能 够 
以 更 高 的 速率 发 送 而 不 会 使 网 络 拥塞。 那么 TCP 发 送 方 如 何 确 定 它们 的 发 送 速率 ， 既 使 得 
网 络 不 会 拥塞 ， 与 此 同时 又 能 充分 利用 所 有 可 用 的 市 宽 ? TCP 发 送 方 是 显 式 地 协作 ， 或 存 
在 一 种 分 布 式 方法 使 TCP 发 送 方 能 够 仅 基 于 本 地 信息 设置 它们 的 发 送 速率 ?” TCP 使 用 下 列 
指导 性 原则 回答 这 些 问题 : 
© 一 个 丢失 的 报 文 段 表 意味 着 拥塞 ， 因 此 当 拔 失 报 文 段 时 应 当 降 低 TCP 发 送 方 的 速 
率 。 回 想 在 3.5.4 中 的 讨论 ， 对 于 给 定 报 文 段 ， 一 个 超时 事件 或 四 个 确认 (一 
个 初始 ACK 和 其 后 的 三 个 元 余 ACK) 被 解释 为 跟随 该 四 个 ACK 的 报 文 段 的 “ 丢 
包 事 件 ” 的 一 种 隐 含 的 指示 。 从 拥塞 控制 的 观点 看 ， 该 问题 是 TCP 发 送 方 应 当 如 
何 减 小 它 的 拥塞 窗口 长 度 ， 即 减 小 其 发 送 速率 ， 以 应 对 这 种 推测 的 丢 包 事件 。 
© 一 个 确认 报 文 段 指示 该 网 络 正 在 向 接收 方 交付 发 送 方 的 报 文 段 ， 因 此 ， 当 对 先前 
未 确认 报 文 段 的 确认 到 达 时 ， 能 够 增加 发 送 方 的 速率 。 确 认 的 到 达 被 认为 是 一 切 
顺利 的 隐 仿 指示， 即 报 文 段 正 从 发 送 方 成 功 地 交付 给 接收 方 ， 因 此 该 网 络 不 拥塞 。 
拥塞 窗口 长 度 因 此 能 够 增加 。 
e 带宽 探测 。 给 定 ACK 指示 源 到 目的 地 路 径 无 拥塞， 而 丢 包 事件 指示 路 径 拥 塞 ， 
TCP 调节 其 传输 速率 的 策略 是 增加 其 速率 以 啊 应 到 达 的 ACK， 除 非 出 现 丢 包 事 件 ， 
此 时 才 减 小 传输 速率 。 因 此 ， 为 探测 拥塞 开始 出 现 的 速率 ，TCP 发 送 方 增加 它 的 
传输 速率 ， 从 该 速率 后 退 ， 进 而 再 次 开始 探测 ， 看 看 拥塞 开始 速率 是 否 发 生 了 变 
化 。TCP 发 送 方 的 行为 也 许 类 似 于 要 求 (并 得 到 ) 越 来 越 多 糖果 的 孩子 ， 直 到 最 
后 告知 他 /她 “不 行 !”， 孩 子 后 退 一 点 ， 然 后 过 一 会 儿 再 次 开始 提出 请 求 。 注 意 到 
网 络 中 没有 明确 的 拥塞 状态 信 令 ， 即 ACK AIF SE EY Tastes, FART 
TCP 发 送 方 根据 异步 于 其 他 TCP 发 送 方 的 本 地 信息 而 行动 。 


a 


MOA T TCP 拥塞 控制 后 ， 现 在 是 我 们 考虑 广 受 赞誉 的 TCP 拥塞 控制 算法 (TCP con- 
gestion control algorithm) 细节 的 时 候 了 ， 该 算法 首先 在 | Jacobson 1988] 中 描述 并 且 在 
[RFC 5681] 中 标准 化 。 该 算法 包括 3 个 主要 部 分 : OA; OWE; OPH! . 
慢 启 动 和 拥塞 避免 是 TCP 的 强制 部 分 ， 两 者 的 差异 在 于 对 收 到 的 ACK 做 出 反应 时 增加 
cwnd 长 度 的 方式 。 我 们 很 快 将 会 看 到 慢 启动 比 拥塞 避免 能 更 快 地 增加 cwnd 的 长 度 (不 要 
被 名 称 所 迷惑 !) 。 快 速 恢 复 是 推荐 部 分 ， 对 TCP 发 送 方 并 非 是 必需 的 。 

1. HEB 

当 一 条 TCP 连接 开始 时 ，cwnd 的 值 通 。 ”主机 人 
常 初始 置 为 一 个 MSS 的 较 小 值 [ RFC | 
3390 | ， 这 就 使 得 初始 发 送 速率 大 约 为 MSS/ 
RTT. flun, Wn MSS =500 字 节 且 RTT = 


te, MAA ea St | O 
20kbps 。 由 于 对 TCP AKA ia. n HE oe RTT J 


可 能 比 MSS/RTT 大 得 多 ，TCP 发 送 方 希望 一 
迅速 找到 可 用 带宽 的 数量 。 因 此 ， 在 慢 启动 sates 

(slow-start) 状态 ，cwnd 的 值 以 1 个 MSS JF -as 
只 并 且 每 当 传输 的 报 文 段 首次 被 确认 就 增加 ~ — 
1 个 MSS。 在 图 3-51 所 示 的 例子 中 ，TCP 向 
网 络 发 送 第 一 个 报 文 段 并 等 待 一 个 确认 。 妆 





i ig 全 = ies Pega SE HE 

该 确认 到 达 时 ，TCP 发 送 方 将 拥塞 窗口 增加 | ite —p 

一 个 MSS， 并 发 送出 两 个 最 大 长 度 的 报 文 — 

段 。 这 两 个 报 文 段 被 确认 ， 则 发 送 方 对 每 个 > 

确认 报 文 段 将 拥塞 窗口 增加 一 个 MSS， 使 得 ”一 一 

拥塞 窗口 变 为 4 个 MSS， 并 这 样 下 去 。 这 一 + 5 

过 程 每 过 一 个 RTT， 发 送 速率 就 翻番 。 因 时 间 时 间 
此 ，TCP 发 送 速率 起 始 慢 ， 但 在 慢 启 动 阶段 图 3-51 TCP 慢 启动 

以 指数 增长 。 


但 是 ， 何 时 结束 这 种 指数 增长 呢 ?” 慢 启动 对 这 个 问题 提供 了 几 种 答案 。 首 先 ， 如 果 存 
在 一 个 由 超时 指示 的 丢 包 事件 EAE), TCP 发 送 方 将 cwnd 设置 为 1 并 重新 开始 慢 局 动 
过 程 。 它 还 将 第 二 个 状态 变量 的 值 ssthresh (“ 慢 局 动 国人 ”的 速记 ) 设置 为 ewnd/2， 
即 当 检测 到 拥塞 时 将 ssthresh 置 为 拥塞 窗口 值 的 一 半 。 慢 启动 结束 的 第 二 种 方式 是 直接 
与 ssthresh 的 值 相 关联 。 因 为 当 检测 到 拥塞 时 ssthresh 设 为 ewnd 的 值 一 半 ， 当 到 达 或 超过 
ssthresh 的 值 时 ， 继 续 使 cwnd 翻番 可 能 有 些 鲁 莽 。 因 此 ， 当 cwnd 的 值 等 于 ssthresh 时 ， 
结束 慢 局 动 并 且 TCP 转移 到 拥塞 避免 模式 。 我 们 将 会 看 到 ， 当 进入 拥塞 避免 模式 时 ， 
TCP 更 为 谨慎 地 增加 cwnd。 最 后 一 种 结束 慢 启 动 的 方式 是 ， 如 果 检 测 到 3 个 元 余 ACK, 
这 时 TCP 执行 一 种 快速 重 传 (参见 3.5.4 节 ) 并 进入 快速 恢复 状态 ， 后 面 将 讨论 相关 
内 容 。 慢 局 动 中 的 TCP 行为 总 结 在 图 3-52 中 的 TCP 拥塞 控制 的 FSM 描述 中 。 慢 局 动 算 
法 最 早 源 于 [ Jacobson 1988]; 在 [Jain 1986] 中 独立 地 提出 了 一 种 类 似 于 慢 局 动 的 
Dike 
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new ACK new ACK 
duplicate ACK cwnd=cwnd+MSS cwnd«cwnd+MSS -(MSS/ewnd) 
dupACKcount++ dupACKcount=0 dupACKcount=0 
transmit new segment(s), as allowed transmit new segment(s), as allowed 
A 
ewnd=1 MSS 
ssthresh=64 KB cwnd 2ssthresh 
dupACKcount=0 ~. i A 
timeout timeout 
ssthresh*cwnd/2 sathresh=cwnd/2 
cwnd=1 MSS cwnd=1 MSS duplicate ACK 
* dupACKcount=06 ee ee 
dupACKcount=0 dupACKcount++ 
retransmit missing segment retransmit missing segment 
timeout 
new ACK 
ssthresh=cwnd/ 2 SN 
cwnd* i cwnd=ssthresn 
dupaACKcount=0 dupACKcount +0 
dupAcKcount==3 retransmit missing segment dupACKcount#=3 
ssthresh=cwnd/ 2 ssthresh=cwnd/ 2 
cwnd=ssthresht3-MSS cwnd=ssthresh+3-MSS 


retransmit missing segment retransmit missing segment 





duplicate ACK t) 


cwnd=cwnd+MSS 
transmit new segment(s), as allowed 


图 3-52 TCP 拥塞 控 制 的 FSM Fie 





TCP RE: 优化 云 服务 的 性 能 


对 于 诸如 搜索 、 电 子 邮 件 和 社交 网 络 等 去 服务， 非常 希望 提供 高 水 平 的 响应 性 ， 给 
用 户 一 种 完美 的 印象 ， 即 这 些 服 务 正 运行 在 它们 自己 的 端 系统 (包括 其 智能 手机 ) 中 . 
因为 用 户 经 常 位 于 远离 数据 中 心 的 地 方 ， 而 这 些 数据 中 心 负责 为 云 服务 关联 的 动态 内 容 
提供 服务 。 实 际 上 ， 如 果 端 系统 远离 数据 中 心 ， 则 RTT 将 会 很 大 ,会 由 于 TCP 慢 局 动 
潜在 地 导致 低劣 的 响应 时 间 性 能 。 

作为 一 个 学 习 案 例 ， 考 虑 接收 对 某 搜索 问题 的 响应 中 的 时 延 。 通 和 常 ， 服 务 器 在 慢 局 
动 期 间 交 付 响应 要 求 三 个 TCP 窗口 | Pathak 2010 ]。 所 以 从 某 端 系统 发 起 一 条 TCP 连接 
到 它 收 到 该 响应 的 最 后 一 个 分 组 的 时 间 粗 略 是 4*RIT (用 于 建立 TCP 连接 的 一 个 RTT 
加 上 用 于 3 个 数据 窗口 的 3 个 RTT)， 再 加 上 在 数据 中 心中 处 理 的 时 间 。 对 于 一 个 相当 
sy 这 些 RTT 时 延 导致 其 返回 搜索 结果 中 显而易见 的 时 延 。 此 外 ， 在 接 入 网 
| 能 有 较 大 的 丢 包 ， 导 致 TCP 重 传 甚至 较 大 的 时 延 。 

“ae 个 问题 和 改善 用 户 感受 到 的 性 能 的 一 个 途径 是 : 山 部 署 邻近 用 户 的 前 端 服务 
BR. 人 2) 在 该 前 端 服务 器 利用 下 CP 分 名 (TCP splitting) #23 TCP 连接 。 借 助 于 TCP 分 
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岔 ， 客 户 向 邻近 前 端 连 接 一 条 TCP 连接 ， 并 且 该 前 端 以 非常 大 的 窗口 向 数据 中 心 维 护 一 
条 TCP 连接 [Tariq 2008, Pathak 2010, Chen 2011 |。 使 用 这 种 方法 ， 响 应 时 间 大 致 变 
为 4*RTIT + RIT, + 处 理 时 间 ， 其 中 RTTj 是 客户 与 前 端 服务 器 之 间 的 往返 时 间 ， 
RTTM 是 前 端 服务 器 与 数据 中 心 (后 端 服务 器 ) 之 间 的 往返 时 间 ,。 如果 前 端 服务 器 邻近 
客户 ， 则 该 响应 时 间 大 约 变 为 RTT,, 加 上 处 理 时 间 ， 因 为 RIT, 小 得 微不足道 并 且 RTT o 
约 为 RTT。 总 而 言 之 ，TCP 分 岔 大 约 能 够 将 网 络 时 延 从 4 RTT 减少 到 RTT, BAH 
善 用 户 感受 的 性 能 ， 对 于 远离 最 近 数 据 中心 的 用 户 更 是 如 此 ，TCP 分 岔 也 有 助 于 减少 因 
接 入 网 丢 包 引起 的 TCP EE, AR, Google 和 Akamai 在 接 入 网 中 广泛 利用 了 它们 
的 CDN 服务 器 (参见 7.2 节 )， 为 它们 支持 的 云 服 务 来 执行 TCP FB [Chen 2011]. 


2. HEME 

一 旦 进入 拥塞 避免 状态 ，cwnd FY ELAR A BE Oe at NPA FE A FY gee EE BS PH 2E 
可 能 并 不 遥远 ! 因此 ，TCP 无 法 每 过 一 个 RTT 再 将 cwnd 的 值 翻 番 ， 而 是 采用 了 一 种 较为 
保守 的 方法 ， 每 个 RTT 只 将 cwnd 的 值 增 加 一 个 MSS [RFC 5681], ix ren 以 几 种 方式 完 
成 。 一 种 通用 的 方法 是 对 于 TCP 发 送 方 无 论 何 时 到 ii ns 就 将 ewnd 增加 一 个 
MSS (MSS/ewnd) 字 节 。 例如， 如 果 MSS 是 1460 7447 5+ AL cwnd 是 14 600 7, ME — 
个 RTT 内 发 送 10 个 报 文 段 。 每 个 到 达 icc (eke ice 增加 1/10MSS 
的 拥塞 窗口 长 度 ， 因 此 在 收 到 对 所 有 10 个 报 文 段 的 确认 后 ， 拥 寒窗 口 的 值 将 增加 了 一 
个 MSS. 

但 是 何 时 应 当 结 束 拥塞 避免 的 线性 增长 (每 RTT IMSS) 呢 ?” 当 出 现 超时 时 ，TCP 的 
拥塞 避免 算法 行为 相同 。 与 慢 启 动 的 情况 一 样 ，cwnd 的 值 被 设置 为 1 个 MSS， 当 于 包 事 件 
出 现时 ，ssthresh 的 值 被 更 新 为 cwnd 值 的 一 半 。 然 而 ， 前 面 讲 过 丢 包 事 件 也 能 由 一 个 三 个 
JIER ACK 事件 触发 。 在 这 种 情况 下 ， 网 络 继续 从 发 送 方 回 接收 方 交 付 报 文 段 (就 像 由 收 
FIICA ACK 所 指示 的 那样 ) 。 因 此 TCP 对 这 种 丢 包 事件 的 行为 ， 相 比 于 超时 指示 的 丢 包 ， 
应 当 不 那么 剧烈 : TCP 将 cwnd 的 值 减 半 (为 使 测量 结果 更 好 ， 计 及 已 收 到 的 3 个 元 余 的 
ACK 要 加 上 3 个 MSS)， 并 且 当 收 到 3 MIRAI ACK, Hf ssthresh 的 值 记 录 为 cwnd 的 值 的 
一 半 。 接 下 来 进入 快速 恢复 状态 。 

3. 快速 恢复 

在 快速 恢复 中 ， 对 于 引起 TCP 进入 快速 恢复 状态 的 缺失 报 文 段 ， 对 收 到 的 每 个 元 余 的 
ACK, ewnd 的 值 增加 一 个 MSS。 最 终 ， 当 对 丢失 报 文 段 的 一 个 ACK 到 达 时 ，TCP 在 降低 
cwnd 后 进入 拥塞 避免 状态 。 如 果 出 现 超时 事件 快速 恢复 在 执行 如 同 在 慢 启 动 和 拥 窟 避 
免 中 相同 的 动作 后 ， 迁 移 到 慢 启 动 状态 : 当 丢 包 事 件 出 现时 ，cwnd 的 值 被 设置 为 1 个 
MSS， 并 且 ssthresh 的 值 设置 为 cwnd 值 的 一 半 。 

快速 恢复 是 TCP 推荐 的 而 非 必需 的 构件 [| RFC 5681]. 有趣 的 是 ， 一 种 称 为 TCP 
Tahoe 的 TCP 早期 版 本 ， 不 管 是 发 生 超 时 指示 的 丢 包 事件 ， 还 是 发 生 3 AICR ACK 指示 
的 丢 包 事件 ， 都 无 条 件 地 将 其 拥塞 窗口 减 至 1 个 MSS， 并 进入 慢 启 动 阶段 。TCP 的 较 新 版 
本 TCP Reno， 则 综合 了 快速 恢复 。 

图 3-53 图 示 了 Reno 版 TCP 与 Tahoe 版 TCP 的 拥塞 控制 窗口 的 演化 情况 。 在 该 图 中 ， 
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国 值 初始 等 于 8 个 MSS。 在 前 8 个 传输 回合 ，Tahoe 和 Reno RE SAER H2 f H 
在 慢 启 动 阶段 以 指数 速度 快速 念 升 ， 在 第 4 轮 传输 时 到 达 了 国 值 。 然 后 拥塞 窗口 以 线性 速 
EER, HIER 8 轮 传输 后 出 现 3 个 元 余 ACK。 注 意 到 当 该 丢 包 事件 发 生 时 ， 拥 塞 窗口 
值 为 12 x MSS, FE ssthresh 的 值 被 设置 为 0.5 xcwnd =6 xMSS。 在 TCP Reno F, WEH 
口 被 设置 为 cwnd =9MSS， 然 后 线性 地 增长 。 在 TCP Tahoe 下 ， 拥 塞 窗 口 被 设置 为 1 个 
MSS， 然 后 呈 指 数 增长 ， 直 至 到 达 ssthresh 值 为 止 ， 在 这 个 点 它 开始 线性 增长 。 


TCP Reno 


拥塞 窗口 
(以 报 文 段 计 ) 





0 12 3 4 5 6 7 8 9 10 11 12 13 14 15 
传输 回合 
图 3-53 TCP 拥塞 窗口 的 演化 (Tahoe 和 Reno) 


图 3-52 表示 了 TCP 拥塞 控制 算法 〈 即 慢 局 动 、 拥 塞 避免 和 快速 恢复 ) 的 完整 FSM fii 
述 。 该 图 也 指示 了 新 报 文 段 的 传输 或 重 传 的 报 文 段 可 能 出 现 的 位 置 。 尽 管区 分 TCP 差错 探 
制 / 重 传 与 TCP 拥塞 控制 非常 重要 ， 但 是 注意 到 TCP 这 两 个 方面 交织 链接 的 方式 也 很 重要 。 

4. TCP 拥塞 控制 : 回顾 

在 深入 了 解 慢 启动 、 拥 塞 避 免 和 快速 恢复 的 细节 后 ， 现 在 有 必要 退回 来 回顾 一 下 全 
局 。 忽 略 一 条 连接 开始 时 初始 的 慢 启 动 阶段 ， 假 定 丢 包 由 3 AIRA ACK 而 不 是 超时 指 
IR, TCP 的 拥塞 控制 是 : 每 个 RTT 内 cwnd 线性 (加 性 ) 增加 1MSS， 然 后 出 现 3 个 元 余 
ACK 事件 时 cwnd 减 半 ( 乘 性 减 )。 因 此 ，TCP 拥塞 控制 常常 被 称 为 加 性 增 、 乘 性 减 
(Additive- Increase, Multiplicative- Decrease, AIMD) 拥塞 控制 方式 。AIMD 拥塞 控制 引发 了 
在 图 3-54 中 所 示 的 “锯齿 ”行为 ， 这 也 很 好 地 图 示 了 我 们 前 面 TCP 检测 带宽 时 的 直觉 ， 
即 TCP 线性 地 增加 它 的 拥塞 窗口 长 度 (因此 增加 其 传输 速率 ) ， 直 到 出 现 3 个 元 余 ACK 事 
件 。 然 后 以 2 个 因子 来 减少 它 的 拥塞 窗口 长 度 ， 然后 又 开始 了 线性 增长 ， 探 测 是 否 还 有 为 
外 的 可 用 带宽 。 

如 前 所 述 ， 许 多 TCP 实现 采用 了 Reno 算法 [ Padhye 2001], Reno 算法 的 许多 变种 已 
被 提出 [RFC 3782; RFC 2018] 。TCP Vegas 算法 [ Brakmo 1995; Ahn 1995] 试图 在 维持 
较 好 的 吞吐 量 的 同时 避免 拥塞 。Vegas 的 基本 思想 是 : 山 在 分 组 丢失 发 生 之 前 ， 在 源 与 目 
的 地 之 间 检 测 路 由 器 中 的 拥塞 ; @ 当 检测 出 快要 发 生 的 分 组 丢失 时 ， 线 性 地 降低 发 送 速 
率 。 快 要 发 生 的 分 组 丢失 是 通过 观察 RTT 来 预测 的 。 分 组 的 RTT BS, AH ae DH A ik 
严重 。Linux 支持 若干 拥塞 控制 算法 (包括 TCP Reno 和 TCP Vegas) ， 并 且 人 允许 系统 管理 员 配 
置 使 用 哪个 版 本 的 TCP, Æ Linux 版 本 2.6.18 中 ，TCP 默认 版 本 设置 为 CUBIC | Ha 2008 |, 
这 是 为 高 带宽 应 用 开发 的 一 个 TCP 版 本 。 对 于 许多 特色 TCP 的 综述 参见 [Afanasyev 2010 | 。 
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拥塞 窗口 
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时 间 
图 3-54 加 性 增 、 乘 性 减 的 拥塞 控制 


TCP AIMD 算法 基于 大 量 的 工程 见解 和 在 运行 网 络 中 的 拥塞 控制 经 验 而 开发 。 在 TCP 
研发 后 的 十 年 ， 理 论 分 析 显 示 TCP 的 拥塞 控制 算法 用 做 一 种 分 布 式 异 步 优化 算法 ， 使 得 用 
户 和 网 络 性 能 的 几 个 重要 方面 被 同时 优化 | Kelly 1998]. 拥塞 控制 的 丰富 理论 已 经 得 到 发 
展 | Srikant 2004 | 
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5. 对 TOP fei bn 22 MH 

给 出 TCP 的 锯齿 状 行为 后 ， 目 然 要 考虑 一 个 长 存活 期 的 TCP 连接 的 平均 吞吐 量 ( 即 
平均 速率 ) 可 能 是 多 少 。 在 这 个 分 析 中 ， 我 们 将 忽略 在 超时 事件 后 出 现 的 慢 启动 阶段 。 
(这 些 阶段 通常 非常 短 ， 因 为 发 送 方 很 快 就 以 指数 增长 离开 该 阶段 ) 在 一 个 特定 的 往返 间 
RIN, TCP 发 送 数据 的 速率 是 拥塞 窗口 与 当前 RTT 的 函数 。 当 窗口 长 度 是 w 字 节 ， 且 当 
前 往返 时 间 是 RTT 秒 时 ， 则 TCP 的 发 送 速 率 大 约 是 w/RTT。 于 是 ，TCP 通过 每 经 过 1 个 
RTT 将 w 增加 1 个 MSS 探测 出 额外 的 带宽 ， 直 到 一 个 丢 包 事件 发 生 为 止 。 当 一 个 丢 包 事 
件 发 生 时 ， 用 WER w 的 值 。 假 设 在 连接 持续 期 间 RTT A WILE AE, 那么 TCP 的 传输 
速率 在 W/(2 xRTT) 到 W/RTT 之 间 变 化 。 

这 些 假 设 导 出 了 TCP 稳 态 行为 的 一 个 高 度 简化 的 宏观 模型 。 当 速率 增长 至 W/RTT 时 ， 
网 络 丢 戎 来 日 连接 的 分 组 ; 然后 发 送 速 率 就 会 减 半 ， 进 而 每 过 一 个 RTT 就 发 送 速率 增加 
MSSARTT， 直 到 再 次 达到 W/RTT 为 止 。 这 一 过 程 不 断 地 自我 重复 。 因 为 TCP Ait (BI 
速率 ) 在 两 个 极 值 之 间 线 性 增长 ， 所 以 我 们 有 

“is 3a iù 0.75 x W 
一 条 连接 的 平均 吞吐 量 = RTT 

通过 这 个 高 度 理想 化 的 TCP 稳 态 动态 性 模型 ， 我 们 可 以 推出 一 个 将 连接 的 丢 包 率 与 可 
用 市 宽 联 系 起 来 的 有 趣 表达 式 | Mahdavi 1997 ] 。 这 个 推导 将 在 课 后 习题 中 概要 给 出 。 一 
个 根据 经 验 建 立 的 并 与 测量 数据 一 致 的 更 复杂 模型 参见 | Padhye 2000 ] 。 

6 经 高 市 宽 路 径 的 TCP 

认识 到 下 列 事实 是 重要 的 : TCP 拥塞 控制 已 经 演化 了 多 年 并 仍 在 继续 演化 。 对 当前 
TCP 变量 的 总 结 和 TCP 演化 的 讨论 ， 参 见 [ Floyd 2001, RFC 5681, Afanasyev 2010], VI 
住 对 因特网 有 益 的 东西 〈 那 时 大 量 的 TCP 连接 承载 的 是 SMTP、FTP 和 Telnet 流量 ) ， 不 一 
定 对 当今 HTTP 主 竺 的 因特网 或 具有 难以 想象 的 服务 的 未 来 因特网 还 是 有 益 的 。 
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TCP 继续 演化 的 需求 能 够 通过 考虑 网 格 和 云 计算 应 用 所 需要 的 高 速 TCP 连接 加 以 前 
述 . 例如， 考虑 一 条 具有 1500 字 节 报 文 段 和 100ms RTT 的 TCP 连接 ， 假 定 我 们 要 通过 这 
杀 连 接 以 10Cbps 速率 发 送 数据 . 根据 | RFC 3649 ] ,我们 注意 到 使 用 上 述 TCP Fitz 
式 ， 为 了 取得 10Gbps 在 吐 量 ， 平均 拥塞 窗口 长 度 将 需要 是 83 333 个 报 文 段 。 对 如 此 大 量 
的 报 文 段 ， 使 我 们 相当 关注 这 83 333 个 传输 中 的 报 文 段 也 许 会 丢失 。 在 丢失 的 情况 下 ， 将 
会 出 现 什么 情况 呢 ? 或 者 以 为 一 种 方式 说 ， 这 些 传输 的 报 文 段 能 以 何 种 比例 于 失 ， 使 得 在 
图 3-52 中 列 出 的 TCP 拥塞 控制 算法 仍 能 取得 所 布 望 的 10Gbps 速率 ?在 本 草 的 诬 后 习题 
中 ， 和 要 求 读 者 推 叶 出 一 条 TCP 连接 的 存 吐 量 公 式 ， 该 公式 作为 丢 包 率 (L), Eikit A 
(RTT) 和 最 大 报 文 段 氏 度 (MSS) AY eR ŽI: 


1.22 x MSS 
RTT VL 
使 用 该 公式 ， 我 们 能 够 看 到 ， 为 了 取得 10Gbps AAE, 今天 的 TCP Hi ae Pe h FF 
(LAE FEA 2 x10 ”的 报 文 段 丢失 概率 (或 等 价 地 说 ， 对 每 5 000 000 000 个 报 文 段 有 一 个 丢 
包 ) ， 这 是 一 个 非常 低 的 值 。 这 种 观察 导致 许多 研究 人 员 为 这 种 高 速 环 境 特别 设计 新 版 
TCP， 对 这 些 努 力 的 讨论 参见 [Jin 2004, RFC 3649, Kelly 2003, Ha 2008 ] . 


一 条 连接 的 平均 吞吐 量 = 


公平 性 


BIE K RTOP 连接 ， 每 条 都 有 不 同 的 闯 到 端 路 径 ， 但 是 都 经 过 一 段 传输 速率 为 尺 bps 的 
HEBER. (所 谓 瓶 颈 链 路 ， 是 指 对 于 每 条 连接 ， 沿 着 该 连接 路 径 上 的 所 有 其 他 段 链 路 都 不 
拥塞 ， 而 且 与 该 狐 颂 链 路 的 传输 容量 相 比 ， 它 们 都 有 充 是 的 传输 容量 。) 假设 每 条 连接 都 在 
传输 一 个 大 文件 ， 而 且 无 UDP 流量 通过 该 段 瓶 颂 链 路 。 如 果 每 条 连接 的 平均 传输 速率 接近 
RAK， 即 每 条 连接 部 得 到 相同 份额 的 链 路 市 宽 ， 则 认为 该 拥塞 控制 机 制 是 公平 的 . 

TCP 的 AIMD 算法 公平 四 ?尤其 是 假定 可 在 不 同时 间 启 动 并 因此 在 某 个 给 定 的 时 间 点 
可 能 具有 不 同 的 窗口 长 度 情况 下 ， 对 这 些 不 同 的 TCP 连接 还 是 公平 的 吗 ? TCP Ka HE be ft 
的 多 条 TCP 连接 之 间 提 供 对 一 段 壮 颂 链 路 带宽 的 平等 分 享 ， 其 理由 【Chiu 1989] 给 出 了 
一 个 极 好 的 、 直 观 的 解释 . 

我 们 考虑 有 两 条 TCP 连接 共享 一 段 传输 速率 为 R 的 链 路 的 简单 例子 ， 如 图 3-55 中 所 示 。 
我 们 将 假设 这 两 条 连接 有 相同 的 MSS 和 RTT (这 样 如 果 它 们 有 相同 的 拥塞 窗口 长 度 ， 就 会 有 
相同 的 乔 吐 量 ) ， 它 们 有 大 量 的 数据 要 发 送 ， 且 没有 其 他 TCP 连接 或 UDP 数据 报 穿越 该 段 共 
理 链 路 ,我们 还 将 忽略 TCP 的 慢 局 动 阶段 ， 并 假设 TCP 连接 一 直 按 CA 模式 (AIMD) 运行 。 
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图 3-55 两 条 TCP 连接 共享 同一 条 瓶颈 链 路 
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图 3-56 描绘 了 两 条 TCP 连接 实现 的 吞吐 量 情况 。 如 果 TCP 要 在 这 两 条 TCP 连接 之 间 
平等 地 共享 链 路 人 带宽， 那么 实现 的 生 吐 量 曲 线 应 当 是 从 原点 沿 4$? 方 问 的 箭头 回 外 辐射 
(平等 带宽 共享 )。 理 想 情 况 是 ， 两 个 硅 吐 
量 的 和 应 等 于 RR。( 当然 ， 每 条 连接 得 到 相 
同 但 容量 为 0 的 共享 链 路 容量 并 非 我 们 所 < 一 全 带宽 利用 率 曲线 
期 望 的 情况 !) 所 以 我 们 的 目标 应 该 是 使 取 
得 的 吞吐 量 落 在 图 3-56 中 平等 市 宽 共 享 曲 
线 与 全 带宽 利用 曲线 的 交叉 点 附近 的 某 处 。 

假定 TCP 窗口 长 度 是 这 样 的 ， 即 在 某 
给 定时 刻 ， 连 接 1 和 连接 2 实现 了 由 网 3-56 
中 A 点 所 指明 的 吞吐 量 。 因 为 这 两 条 连接 
共同 消耗 的 链 路 带宽 量 小 于 尺 ， 所 以 无 丢 包 
事件 发 生 ， 根 据 TCP 的 拥塞 避免 算法 的 结 
果 ， 这 两 条 连接 每 过 一 个 RTT 都 要 将 其 窗 
口 增加 1 个 MSS。 因 此 ， 这 两 条 连接 的 总 乔 ee eee ' 

吐 量 就 会 从 A 点 开始 沿 45° 线 前 行 (两 条 连 图 3-56 TCP 连接 1 和 连接 2 实现 的 吞吐 量 
接 都 有 相同 的 增长 ) 。 最 终 ， 这 两 条 连接 共同 消耗 的 带宽 将 超过 尺 ， 最 终 将 发 生 分 组 丢失 。 
假设 连接 1 和 连接 2 实现 B 点 指明 的 吞吐 量 时 ， 它 们 都 经 历 了 分 组 丢失 。 连 接 1 和 连接 2 
于 是 就 按 二 分 之 一 减 小 其 窗口 。 所 产生 的 结果 实现 了 C 点 指明 的 吞吐 量 ， 它 正好 位 于 始 于 
B 点 止 于 原点 的 一 个 向 量 的 中 间 。 因 为 在 C 点 ， 共 同 消耗 的 于 宽 小 于 尺 ， 所 以 这 两 条 连接 
再 次 沿 着 始 于 C 点 的 45° 线 增加 其 吞吐 量 。 最 终 ， 青 次 发 生 丢 包 事 件 ， 如 在 DD 点 ， 这 两 条 
连接 再 次 将 其 窗口 长 度 减 半 ， 如 此 等 等 。 你 应 当 搞 清楚 这 两 条 连接 实现 的 带宽 最 终 将 沿 着 
平等 带宽 共享 曲线 在 波动 。 还 应 该 搞 清 楚 无 论 这 两 条 连接 位 于 二 维 空间 的 何 处 ， 它 们 最 终 
都 会 收敛 到 该 状态 ! 虽然 此 时 我 们 做 了 许多 理想 化 的 假设 ， 但 是 它 仍 然 能 对 解释 为 什么 
TCP 会 导致 在 多 条 连接 之 间 的 平等 共享 带宽 这 个 问题 提供 一 个 直观 的 感觉 。 

在 理想 化 情形 中 ， 我 们 假设 仅 有 TCP ERFAR, MAERA +i RTT 
值 ， 且 对 于 一 个 主机 -目的 地 对 而 言 只 有 一 条 TCP 连接 与 之 相关 联 。 实 践 中 ， 这 些 条 件 通 
FA AEE AS BUT ALY, FP -服务 器 应 用 因此 能 获得 非常 不 平等 的 链 路 带宽 份额 。 特 别 是 ， 
已 经 表明 当 多 条 连接 共享 一 个 共同 的 瓶颈 链 路 时 ， 那 些 具 有 较 小 RTT 的 连接 能 够 在 链 路 空 
内 时 更 快 地 抢 到 可 用 带宽 ( 即 较 快 地 打开 其 拥塞 窗口 )， 因 而 将 比 那 些 具 有 较 大 RTT 的 连 
接 享用 更 高 的 吞吐 量 [ Laksman 1997 ] 。 

1. 公平 性 和 UDP 

我 们 刚才 已 经 看 到 ，TCP 拥塞 控制 是 如 何 通过 拥塞 窗口 机 制 来 调节 一 个 应 用 程序 的 传 
输 速 率 的 。 许 多 多 媒体 应 用 如 因特网 电话 和 视频 会 议 ， 经 常 就 因为 这 种 特定 原因 而 不 在 
TCP 上 运行 ， 因 为 它们 不 想 其 传输 速率 被 扼 制 ， 即 使 在 网 络 非 常 拥塞 的 情况 下 。 相 反 ， 这 
些 应 用 宁可 在 UDP 上 运行 ，UDP 是 没有 内 置 的 拥塞 控制 的 。 当 运行 在 UDP 上 时 ， 这 些 应 
用 能 够 以 恒定 的 速率 将 其 音频 和 视频 数据 注入 网 络 之 中 并 且 偶 尔 会 丢失 分 组 ， 而 不 愿 在 拥 
塞 时 将 其 发 送 速率 降 至 “公平 ”级 别 并 且 不 丢失 任何 分 组 。 从 TCP 的 观点 来 看 ， 运 行 在 
UDP 上 的 多 媒体 应 用 是 不 公平 的 ， 因 为 它们 不 与 其 他 连接 合作 ， 也 不 适时 地 调整 其 传输 速 
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率 。 央 为 TCP $y ae Pe iil CE en SF ES CF), ORR EER, mi UDP 源 则 不 
Pix PEK, UDP 源 有 可 能 压制 TCP 流量 。 当 今 的 一 个 主要 人 研究 领域 就 是 开发 一 种 因特网 
中 的 拥 窗 控制 机 市 ， 用 于 阻止 UDP 流量 不 断 压 制 直 至 中 断 因 特 网 吞吐 量 的 情况 | Floyd 
1999; Floyd 2000; Kohler 2006 | 


2. 公平 性 和 并 行 TCP 连接 

即使 我 们 能 够 迫使 UDP 流量 具有 公平 的 行为 ， 但 公平 性 问题 仍然 没有 完全 解决 ,这 
是 因为 我 们 设 有 什么 办 法 阻止 基于 TCP 的 应 用 使 用 多 个 并 行 连接 .例如 ，Web 浏览 融通 党 
使 用 多 个 并 行 TCP 连接 来 传送 一 个 Web 页 中 的 多 个 对 象 。( 多 条 连接 的 确切 数目 可 以 在 多 
数 浏览 磺 中 进行 配置 .) 当 一 个 应 用 使 用 多 条 并 行 连接 时 ， 它 占用 了 一 条 拥塞 链 路 中 较 大 
比例 的 市 宽 。 举例 来 说 ， 考 虑 一 段 速率 为 尺 且 文 持 9 个 在 线 客户 -服务 器 应 用 的 链 路 ， 每 
个 应 用 使 用 一 条 TCP 连接 。 如 果 一 个 新 的 应 用 加 入 进来 ， 也 使 用 一 条 TCP 连接 ， 则 每 个 
应 用 得 到 差不多 相同 的 传输 速率 RX10。 但 是 如 果 这 个 新 的 应 用 这 次 使 用 了 11 个 并 行 TCP 
连接 ， 则 这 个 新 应 用 就 不 公平 地 分 到 超过 R/2 的 带宽 。Web 流量 在 因特网 中 是 非常 普遍 
的 ， 所 以 多 条 并 行 连接 并 非 不 常见 . 


3.8 小 结 


本 章 我 们 首先 学 习 了 运输 层 协议 能 够 向 网 络 应 用 程序 提供 的 服务 。 在 一 个 极端 ， 运 输 
层 协议 非常 简单 ， 并 向 应 用 程序 不 提供 不 必要 的 服务 ， 而 仅 回 通信 进程 提供 多 路 复 用 /分 
解 的 功能 。 因 特 网 中 的 UDP 协议 就 是 这 样 一 种 不 提供 不 必要 服务 的 运输 层 协议 。 在 另 一 
个 极端 ， 运 输 层 协议 能 够 回应 用 程序 提供 各 种 各 样 的 保证 ， 例 如 数据 的 可 靠 交 付 、 时 延 保 
证 和 审 宽 保证 。 无 论 如 何 ， 运 输 层 协议 能 够 提供 的 服务 经 销 受 下 面 网 络 层 协议 服务 模型 的 
限制 。 如 果 网 络 层 协议 不 能 回 运输 层 报 文 段 提供 时 延 或 带宽 保证 ， 那 么 运输 层 协议 就 不 能 
向 进程 间 发 送 的 报 文 提供 时 延 或 带宽 保证 。 

在 3.4 书 中， 我 们 学 习 了 运输 层 协 议 能 够 提供 可 靠 数 据 传输 ， 即 使 下 面 的 网 络 层 是 不 
可 靠 的 。 我 们 看 到 了 提供 可 靠 的 数据 传送 会 遇 到 许多 微妙 的 问题 ， 但 都 可 以 通过 精心 地 结 
合 确认 、 定 时 器 、 重 传 以 及 序号 机 制 来 完成 任务 。 

尽管 在 本 章 中 我 们 包含 了 可 靠 数据 传送 ， 但 是 我 们 应 该 理解 在 链 路 层 、 网 络 层 、 运 输 
层 或 应 用 层 协议 中 都 可 以 提供 可 靠 数 据 传送 。 该 协议 栈 中 上 面 4 层 的 任意 一 层 都 可 以 实现 
确认 、 定 时 需 、 重 传 以 及 序号 ， 能 够 癌 其 上 层 提供 可 靠 数 据 传 送 。 事 实 上， 在 过 去 数 年 
中 ， 工 程 师 以 及 计算 机 科学 家 们 已 经 独立 地 设计 并 实现 了 提供 可 靠 数 据 传送 的 链 路 层 、 网 
络 层 、 运 输 层 以 及 应 用 层 协议 〈 虽 然 这 些 协议 中 的 许多 已 经 销声匿迹 了 ) 。 

在 3.5 节 中 ， 我 们 详细 地 研究 了 TCP 协议 , 它 是 因特网 中 面向 连接 和 可 靠 的 运输 层 协 
i. 我 们 知道 TCP 是 非常 复杂 的 ， 它 涉及 了 连接 管理 、 流 量 控制 、 往 返 时 间 估 计 以 及 可 靠 
数据 传送 。 事实 上 ，TCP 比 我 们 描述 的 要 更 为 复杂 ， 妈 我们 有 意 地 浊 而 不 谈 在 各 种 TCP 实 
现 版 本 中 广泛 实现 的 各 种 TCP 补丁 、 修 复 和 改进 。 然 而 ， 所 有 这 些 复 杂 性 都 对 网 络 层 应 用 
隐藏 了 起 来 。 如 果 某 主机 上 的 客户 和 希望 癌 另 一 台 主 机 上 的 服务 需 可 靠 地 发 送 数据 ， 它 只 需 
要 打开 对 该 服务 需 的 一 个 TCP 套 接 字 ， 然 后 将 数据 注入 该 套 接 字 。 客 户 -服务 器 应 用 程序 
则 乐于 对 TCP 的 复杂 性 视而不见 . 

在 3.6 中 ,我 们 从 广泛 的 角度 研究 了 拥塞 控制 ， 在 3.7 节 中 我 们 阐述 卫 TCP 是 如 何 


ua ig 发 19] 


SEPA SE PE HAY. Fe AE FA EPS il AT FA ei Te AN AY, BCA EE hil, 
网 络 很 容易 出 现 死 锁 ， 使 得 端 到 端 之 间 很 少 或 没有 数据 能 被 传输 。 在 3.7 PRA T 
TCP 实现 的 一 种 端 到 端 拥塞 控制 机 制 ， 即 当 TCP 连接 的 路 径 上 判断 不 拥塞 时 ， 其 传输 速率 
就 加 性 增 ; 当 出 现 委 包 时 ， 传 输 速 率 就 乘 性 减 。 这 种 机 制 也 致力 于 做 到 每 一 个 通过 拥塞 链 
路 的 TCP 连接 能 平等 地 共享 该 链 路 市 宽 。 我 们 也 深入 探讨 了 TCP 连接 建立 和 慢 局 动 对 时 
延 的 影响 。 我 们 观察 到 在 许多 重要 场合 ， 连接 建 立 和 慢 局 动 会 对 端 到 闪 时 延 产 生产 重 影 
啊 。 我 们 再 次 强调 ,尽管 TCP 在 这 几 年 一 直 在 发 展 ， 但 它 仍 然 是 一 个 值得 深 入 研究 的 领 
域 ， 并 且 在 未 来 的 儿 年 中 还 可 能 持 绥 演化 。 

在 本 草 中 我 们 对 特定 因特网 运输 协议 的 讨论 集中 在 UDP 和 TCP E, 它们 是 因特网 运 
输 层 的 两 瞻 “ 驮 马 " 。 然 而 ， 对 这 两 个 协议 的 二 十 多 年 的 经 验 已 经 使 人 们 认识 到 ， 这 两 个 
协议 都 不 是 完美 无 缺 的 。 研 究 人 员 因 此 在 忙于 研制 其 他 的 运输 层 协议 ， 其 中 的 几 种 现在 已 
经 成 为 IETF 建议 的 标准 。 

数据 报 拥塞 控制 协议 (Datagram Congestion Control Protocol, DCCP) [ RFC 4340] 提供 
了 一 种 低 开 销 、 面 回报 文 、 类 似 于 UDP 的 不 可 靠 服务 ,但 是 具有 应 用 程序 可 选择 的 拥塞 
控制 形式 ， 该 机 制 与 TCP 相 兼 容 。 如 果 某 应 用 程序 需要 可 靠 的 或 半 可 靠 的 数据 传送 ， 则 这 
将 在 应 用 程序 目 身 中 执行 〈 也 许 使 用 我 们 已 经 在 3.4 市 中 学 过 的 机 制 )。DCCP 被 设想 用 
于 诸如 流 媒 体 ( 参见 第 7 aE) 等 应 用 程序 中 ，DCCP 能 够 利用 数据 交付 的 预定 时 间 和 可 靠 
性 之 间 的 折 中 ， 但 是 要 对 网 络 拥塞 作出 啊 应 ， 

流 控制 传输 协 以 (Stream Control Transmission Protocol, SCTP) | RFC 4960, RFC 
3286] fe — PPA SENY, ORCA, APP VIL A Tal a oy A eit” H 
到 单个 SCTP 连接 上 (一 种 称 之 为 “多 流 ” 的 方法 )。 从 可 徘 性 的 角度 看 ， 在 该 连接 中 的 
不 同 流 被 分 别处 理 ， 因 此 在 一 条 流 中 的 分 组 丢失 不 会 影响 其 他 流 中 数据 的 交付 。 当 一 台 主 
机 与 两 个 或 更 多 个 网 络 连 接 时 ，SCTP 也 允许 数据 经 两 条 出 路 径 传输 ， 还 具有 失 序 数据 的 
选项 交付 和 一 些 其 他 特色 。SCTP 的 流 控制 和 拥塞 控制 算法 基本 上 与 TCP 中 的 相同 。 

TCP 友好 速率 控制 (TCP- Friendly Rate Control, TFRC) 协议 | RFC 5348] 是 一 种 拥 
旱 控 制 协议 而 不 是 一 种 功能 齐全 的 运输 层 协 议 。 它 定义 了 一 种 拥塞 控制 机 制 ， 该 机 制 能 被 
用 于 诸如 DCCP 等 其 他 运输 协议 (事实 上 在 DCCP 中 可 供 使 用 的 两 种 应 用 程序 可 选 的 协议 
之 一 就 是 TFRC)。TFRC 的 目标 是 平滑 在 TCP 拥塞 控制 中 的 “锯齿 ”行为 《参见 网 3-54), 
同时 维护 一 种 长 期 的 发 送 速 率 ， 该 速率 “合理 地 ”接近 TCP 的 速率 。 使 用 比 TCP 更 为 平 
滑 的 发 送 速 率 ，TFRC 非常 适合 诸如 P 电话 或 流 媒 体 等 多 媒体 应 用 ， 这 种 平滑 的 速率 对 于 
这 些 应 用 是 重要 的 。TFRC 是 一 种 “基于 方程 ”的 协议 ， 这 些 协 议 使 用 测 得 的 丢 包 率 作 为 
方程 的 输入 [Padhye 2000), ， 即 使 用 方程 估计 一 个 TCP 会 话 在 该 丢 包 率 下 TCP 的 吞吐 量 将 
是 多 大 。 该 速率 则 被 取 为 TFRC 的 目标 发 送 速率 。 

唯 有 未 来 才能 告诉 我 们 DCCP, SCTP 或 TFRC 是 否 能 得 到 广泛 实施 。 昌 然 这 些 协 议 明确 
地 提供 了 超过 TCP 和 UDP 的 强化 能 力 ， 但 是 多 年 来 已 经 证 明了 TCP Al UDP 目 身 是 “足够 
好 ”的 。 是 否 “ 更 好 ”将 胜出 “足够 好 ”， 这 将 取决 于 技术 、 社 会 和 商业 考虑 的 复杂 组 合 。 

在 第 1 章 中 ， 我 们 讲 到 计算 机 网 络 能 被 划分 成 “网 络 边缘 ”和 “网 络 核心 。 网 络 边 
缘 包 含 了 在 端 系 统 中 发 生 的 所 有 事情 。 既 然 已 经 覆盖 了 应 用 层 和 运输 层 ， 我 们 关于 网 络 边 
缘 的 讨论 也 就 结束 了 。 接 下 来 是 探寻 网 络 核心 的 时 候 了 1! 我 们 的 旅程 从 下 一 章 开 始 ， 下 一 
草 将 学 习 网 络 层 ， 并 且 将 在 第 5 章 继续 学 习 链 路 层 。 
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课 后 习题 和 问题 
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~3.3 P 

假定 网 络 层 提 供 了 下 列 服务 。 在 源 主 机 中 的 网 络 层 接受 最 大 长 度 1200 字 节 和 来 自 运 输 层 的 目的 主机 

地 址 的 报 文 段 。 网 络 层 则 保证 将 该 报 文 段 交 付 给 位 于 目的 主机 的 运输 层 。 假 定 在 目的 主机 上 能 够 到 

行 许多 网 络 应 用 进程 。 

a. 设计 可 能 最 简单 的 运输 层 协议 ,该 协议 将 使 应 用 程序 数据 到 达 位 于 目的 主机 的 所 希望 的 进程 。 仿 
设 在 目的 主机 中 的 操作 系统 已 经 为 每 个 运行 的 应 用 进程 分 配 了 一 个 4 ES 

b. 修改 这 个 协议 ,使 它 向 目的 进程 提供 一 个 的 “返回 地 址 ”。 

c. 在 你 的 协议 中 ， 该 运输 层 在 计算 机 网 络 的 核心 中 “必须 做 任何 事 ” 吗 ? 


. 考虑 有 一 个 星球 ， 每 个 人 都 属于 某 个 六 口 之 家 ， 每 个 家 庭 都 住 在 自己 的 房子 里 ， 每 个 房子 都 一 个 唯 


一 的 地 址 ， 并 且 某 给 定 家 庭 中 的 每 个 人 有 一 个 独特 的 名 字 。 假 定 该 星球 有 一 个 从 源 家 庭 到 目的 家 庭 

交付 信件 的 邮政 服务 。 该 邮件 服务 要 求 : 山 在 一 个 信封 中 有 一 封 信 ; @ 在 信封 上 清楚 地 写 上 目的 家 

庭 的 地 址 (并且 没有 别 的 东西 )。 假设 每 个 家 庭 有 一 名 家 庭 成 员 代 表 为 家 庭 中 的 其 他 成 员 收 集 和 分 

发 信件 。 这 些 信 没 有 必要 提供 任何 有 关 信 的 接收 者 的 指示 。 

a. 使 用 对 上 面 复 习题 R1 的 解决 方案 作为 启发 ， 描 述 家 庭 成 员 代表 能 够 使 用 的 协议 ， 以 从 发 送 家 许 
成 员 问 接收 家 庭 成 员 交 付 信件 . 

b. 在 你 的 协议 中 ， 该 邮政 服务 必须 打开 信封 并 检查 信件 内 容 才 能 提供 它 的 服务 吗 ? 

考虑 在 主机 A 和 主机 B 之 间 有 一 条 TCP 连接 。 假设 从 主机 A 传送 到 主机 B 的 TCP RREA Wiin H 

号 x 和 目的 端口 号 y。 对 于 从 主机 B 传送 到 主机 A 的 报 文 段 ， 源 端口 号 和 目的 端口 号 分 别 是 多 少 ? 

描述 应 用 程序 开发 者 为 什么 可 能 选择 在 UDP 上 运行 应 用 程序 而 不 是 在 TCP 上 运行 的 原因 。 

在 今天 的 因特网 中 ， 为 什么 语音 和 图 像 流 量 常 常 是 经 过 TCP 而 不 是 经 UDP Riž, (Rr: 我 们 寻找 

的 答案 与 TCP 的 拥塞 控制 机 制 没有 关系 。) 

当 某 应 用 程序 运行 在 UDP 上 时 ， 该 应 用 程序 可 能 得 到 可 靠 数据 传输 吗 ?” 如果 能 ， 如 何 实现 ? 

假定 在 主机 C 上 的 一 个 进程 有 一 个 具有 端口 号 6789 的 UDP 套 接 字 。 假 定 主 机 A 和 主机 B 都 用 目的 

端口 号 6789 向 主机 C 发 送 一 个 UDP 报 文 段 。 这 两 台 主 机 的 这 些 报 文 段 在 主机 C 都 被 描述 为 相同 的 

套 接 字 吗 ?” 如 果 是 这 样 的 话 ， 在 主机 C 的 该 进程 将 怎样 知道 源 于 两 台 不 同 主机 的 这 两 个 报 文 段 ? 

假定 在 主机 C 端口 80 上 运行 的 一 个 Web 服务 器 。 假 定 这 个 Web 服务 器 使 用 持续 连接 ， 并 且 正 在 接 

收 来 自 两 台 不 同 主 机 A 和 B 的 请 求 。 被 发 送 的 所 有 请 求 都 通过 位 于 主机 C 的 相同 套 接 字 吗 ? 如 果 它 

们 通过 不 同 的 套 接 字 传 递 ， 这 两 个 套 接 字 都 具有 端口 80 吗 ? 讨论 和 解释 之 。 


有 


. 在 我 们 的 rdt 协议 中 ， 为 什么 需要 引 和 人 序 号 ? 
. 在 我 们 的 rdt 协议 中 ， 为 什么 需要 引入 定时 兹 ? 


TE 发 送 方 和 接收 方 之 间 的 往返 时 延 是 固定 的 并 且 为 发 送 方 所 知 。 假 设 分 组 能 够 丢失 的 话 ， 在 协议 
rd3.0 中 ， 一 个 定时 磊 仍 是 必需 的 吗 ? 试 解 释 之 。 


. 在 配套 网 站 上 使 用 Co-Back-N (PHE N) Java 小 程序 。 
a. 让 源 发 送 5 个 分 组 ， 在 这 5 个 分 组 的 任何 一 个 到 达 目 的 地 之 前 暂停 该 动画 、 然 后 毁 掉 第 一 个 分 组 


并 继续 该 动画 。 试 描述 发 生 的 情况 。 
b 重复 该 实验 ， 只 是 现在 让 第 一 个 分 组 到 达 目 的 地 并 毁 掉 第 一 个 确认 。 再 次 描述 发 生 的 情况 。 
c. 最 后 ， 尝 试 发 送 6 个 分 组 。 发 生 了 什么 情况 ? 
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R13. 重复 复习 题 R12， 但 是 现在 使 用 Selective Repeat (选择 重 传 ) Java 小 程序 。 选 择 重 传 和 回 退 N 步 有 
什么 不 同 ? 
3.5 F 
R14. 是 非 判 断 题 : 
a. 主机 A 经 过 一 条 TCP 连接 向 主机 B 发 送 一 个 大 文件 。 假 设 主机 B 没有 数据 发 往 主 机 A。 因 为 主 
HLB ARERR RCA HE TA, EBL B 将 不 向 主机 A 发 送 确 认 。 
b. 在 连接 的 整个 过 程 中 ，TCP 的 rwnd 的 长 度 决 不 会 变化 。 
c 假设 主机 A 通过 一 条 TCP 连接 向 主机 B 发 送 一 个 大 文件 。 主 机 A 发 送 但 未 被 确认 的 字 市 数 不 会 
超过 接收 缓存 的 大 小 。 
d. 假设 主机 A 通过 一 条 TCP 连接 向 主机 B 发 送 一 个 大 文件 。 如 果 对 于 这 条 连接 的 一 个 报 文 段 的 序 
号 为 m， 则 对 于 后 继 报 文 段 的 序号 将 必然 是 m+1。 
e. TCP 报 文 段 在 它 的 首部 中 有 一 个 rwnd FR, 
f 假定 在 一 条 TCP 连接 中 最 后 的 SampleRTT 等 于 1 秒 ， 那 么 对 于 该 连接 的 Timeoutlnterval 的 当前 值 
必定 大 于 等 于 1 秒 。 
g 假设 主机 A 通过 一 条 TCP 连接 向 主机 B 发 送 一 个 序号 为 38 的 4 个 字 节 的 报 文 段 。 在 这 个 相同 的 
报 文 段 中 ， 确 认 号 必定 是 42。 
R15. 假设 主机 A 通过 一 条 TCP 连接 向 主机 B 发 送 两 个 紧 接 着 的 TCP 报 文 段 。 第 一 个 报 文 段 的 序号 为 90， 
第 二 个 报 文 段 序号 为 110。 
a. 第 一 个 报 文 段 中 有 多 少数 据 ? 
b. 假设 第 一 个 报 文 段 丢 失 而 第 二 个 报 文 段 到 达 主 机 B。 那 么 在 主机 B 发 往 主机 A 的 确认 报 文中 ， 
确认 号 应 该 是 多 少 ? 
R16. 考虑 在 3.5 节 中 讨论 的 Telnet 的 例子 。 在 用 户 键入 字符 C 数秒 之 后 ， 用 户 又 键 人 字符 R。 那 么 在 用 
户 键 入 字符 R 之 后 ， 总 共 发 送 了 多 少 个 报 文 段 ， 这 些 报 文 段 中 的 序号 和 确认 字段 应 该 填 人 什么 ? 
3. % T 
R17. 假设 两 条 TCP 连接 存在 于 一 个 带宽 为 R bps 的 瓶颈 链 路 上 。 它 们 都 要 发 送 一 个 很 大 的 文件 〈 以 相同 


R18. 


R19. 


方向 经 过 瓶颈 链 路 ) ， 并 且 两 者 是 同时 开始 发 送 文件 。 那 么 TCP 将 为 每 条 连接 分 配 什 么 样 的 传输 
速率 ? 

是 非 判 断 题 。 考虑 TCP 的 拥塞 控制 。 当 发 送 方 定时 器 超时 时 ， 其 ssthresh 的 值 将 被 设置 为 原来 值 的 
ye 0 

在 3.7 WAY “TCP RR” pie Ph, MF TCP 分 贫 的 啊 应 时 间 ， 断 言 大 约 是 4* RTT,, + RTT, + 处 理 
时 间 。 评价 该 断言 。 


习题 


Pl. 假设 客户 A 加 服务 器 S 发 起 一 个 Telnet Sih, Sly, APB 也 回 服务 需 S 发 起 一 个 Telnet 会 话 。 
给 出 下 面 报 文 段 的 源 羡 口号 和 目的 端口 号 : 
a. 从 A W S 发送 的 报 文 段 。 
b. M B 向 S 发 送 的 报 文 段 。 
c JA S A 发 送 的 报 文 段 。 


d 


€. 


f. 


.从 S$ 回 了 发 送 的 报 文 段 。 

如 果 A 和 B 是 不 同 的 主机 ， 那 么 从 A m S 发 送 的 报 文 段 的 源 端 口号 是 否 可 能 与 从 B 回 S 发送 的 报 
文 段 的 源 端 口号 相同 ? 

如 果 它 们 是 同一 台 主 机 ， 情 况 会 怎么 样 ? 


P2. 考虑 图 3-5。 从 服务 器 返回 客户 进程 的 报 文 流 中 的 源 端 口号 和 目的 端口 号 是 多 少 在 承载 运输 层 报 文 


X 
i 


194 


段 的 网 络 层 数 据 报 中 ，IP 地 址 是 多 少 ? 

P3. UDP 和 TCP 使 用 反 码 来 计算 它们 的 检验 和 。 假设 你 有 下 面 3 个 8 比特 字 节 : 01010011, 01100110, 
01110100， 这 些 8 比特 字 节 和 和 的 反 码 是 多 少 ? (注意 到 尽管 UDP 和 TCP 使 用 16 比特 的 字 来 计算 检验 
和 ， 但 对 于 这 个 问题 ， 你 应 该 考虑 8 比特 和 -) 写 出 所 有 工作 过 程 : UDP 为 什么 要 用 该 和 的 反 码 ， 即 
为 什么 不 百 接 使 用 该 和 呢 ” 使 用 该 反 公 方案 ， 接 收 方 如何 检 测 出 差错 ? 1 比特 的 差错 将 可 能 检测 不 出 
米 吗 ?2 比特 的 差错 呢 ? 


P4. a. 假定 你 有 下 列 2 个 字 节 : 01011100 和 01100101。 这 2 个 字 节 之 和 的 反 公 是 什么 
b 假定 你 有 下 列 2 个 字 节 : 11011010 #101100101., 3X2 Re 
ce 对 于 (a) 中 的 宇 节 ，、 给 出 一 个 例子 ， 使 得 这 2 个 字 节 中 的 每 一 个 都 在 一 个 比特 反 转 时 ， 其 反 人 码 不 


会 改变 ， 
PS. {ne SE UDP 接收 方 对 接收 到 的 UDP 报 文 段 计算 因特网 检验 和 ， 并 发 现 它 与 承载 在 检验 和 字段 中 的 值 
相 匹 配 。 该 接收 方 能 够 绝对 确信 没有 出 现 过 比特 差错 吗 ?” 试 解释 之 
P6. 考虑 我 们 改正 协议 rdt2. 1 的 动机 。 斌 说明 如 图 3-57 所 示 的 接收 方 与 如 图 3-11 所 示 的 发 送 方 运行 时 ， 
接收 方 可 能 会 引起 发 送 方 和 接收 方 进 入 死 锁 状 态 ， 即 双方 都 在 等 待 不 可 能 发 生 的 事件 


rdt_rvce(rcvpkt) k notcorrupt(rcevpkt ) 
&& has seq0(rcvpkt) 


extract (revpkt,data) 

deliver data(data) 

compute chksum 

make pkt(sendpkt,ACK,chksum) 
udt send(sndpkt} 


L om 


rdt_recv(rcevpkt) 66 
(corrupt (revpkt) | | 
has _seg0(rcevpkt))) 








compute chksum 
make pkt(sndpkt,NAK,chksum) 


rdt revirevpkt) && udt send(sndpkt) 


(corrupt (revpkt) | | 
has segi(rcvpkt))) 


compute chksum 

make pkt(sndpkt,NAK,chksum) 

udt send(sndpkt} rdt_rvc(rcvpkt) ké notcorrupt(revpkt) 
áá has seg)(rcvpkt) 


extract(rcevpkt,data} 

deliver data(data) 

compute chksum 

make pkt(sendpkt,ACK,chksum) 
udt send(sndpkt ) 


图 3-57 协议 rdt2.1 的 一 个 不 正确 的 接收 方 


P7. 在 rda. 0 协议 中 ， 从 接收 方向 发 送 方 流动 的 ACK 分 组 没有 序号 (尽管 它们 具有 ACK 字段 ， 该 字段 包 
括 了 它们 正在 确认 的 分 组 的 序号 ) 。 为 什么 这 些 ACK 分 组 不 需要 序号 呢 ? 
ee 
. 当 数 据 分 组 和 确认 分 组 发 生 臭 改 时 ， 给 出 rdB.0 协议 运行 的 轨迹 。 你 画 的 轨迹 应 当 类 似 于 图 3-16 中 
所 用 的 图 . 

PIO. 考虑 一 个 能 够 丢失 分 组 但 其 最 大 时 延 已 知 的 信道 。 修 改 协 议 rde2. 1， 以 包括 发 送 方 超时 和 重 传 机 制 ; 
非 正 式 地 论证 : 为 什么 你 的 协议 能 够 通过 该 信道 正确 通信 ? 

Pll. 考虑 在 图 3-14 中 的 rdt2.2 接收 方 ， 在 状态 “每 待 来 自 下 层 的 0” 和 状态 “等 待 来 自 下 层 的 1” 中 的 
日 转换 〈( 即 从 某 状 态 转换 回 自身 ) 中 生成 一 个 新 分 组 : sndpk = make_ pkt (ACK, 1, checksum) 和 
sndpk = make_ pkt (ACK, 0, checksum). 如果 这 个 动作 从 状态 “等 待 来 自 下 层 的 1” 中 的 自转 换 
中 删除 ， 该 协议 将 正确 工作 吗 ” 评 估 你 的 答案 。 在 状态 “等 待 来 自 下 层 的 0” 中 的 自转 换 中 删除 这 
个 事件 将 会 怎样 ? [ 提示: 在 后 一 种 情况 下 ， 考 虑 如 果 第 一 个 发 送 方 到 接收 方 的 分 组 损坏 的 话 ， 将 
会 发 生 什 么 情况 ?] 


PIZ. 


P13. 


P14. 


P16. 


FIZ. 


P18. 


P19. 
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rdB3.0 协议 的 发 送 方 百 接 忽略 CBI AS UE toy SE) 接收 到 的 所 有 出 现 差错 和 确认 分 组 的 确认 号 
(acknum) 字段 中 的 什 有 差错 的 分 组 。 假 设 在 这 种 情况 下 ，rdt3.0 只 是 重 传 当前 的 数据 分 组 .该 协 
议 是 否 还 能 正常 运行 ? (提示 : 考虑 在 下 列 情况 下 会 发 生 什 么 情况 : 仅 有 一 个 比特 差错 时 ; 报 文 没 
有 丢失 但 能 出 现 定 时 需 过 早 超时 : HER n BFAR, Bn 个 分 组 将 被 发 送 多 少 次 .) 

BE rdt 3.0 协议 。 如 果 发 送 方 和 接收 方 的 网 络 连接 能 够 对 报 文 午 排序 ( 即 在 发 送 方 和 接收 方 之 间 
的 媒体 上 传播 的 两 个 报 文 段 能 重新 排序 )， 那 么 比特 交替 协议 将 不 能 正确 工作 (确信 你 清楚 地 理解 
这 时 它 不 能 正确 工作 的 原因 ) ， 试 画图 说 明之 。 画图 时 把 发 送 方 放 在 左边 ， 接 收 方 放 在 右边 、 使 时 
间 轴 朝 下 ， 标 出 区 换 的 数据 报 文 《D) 和 确认 报 文 (A)。 要 标明 与 任何 数据 和 确认 报 文 段 相关 的 
序号 

若 赎 一 种 仅 使 用 否定 确认 的 可 靠 数 据 传输 协议 。 假定 发 送 方 只 是 偶尔 发 送 数据 。 只 用 NAK 的 协议 
是 否 会 比 使 用 ACK 的 协议 更 好 ?为 什么 ”现在 我 们 假设 发 送 方 要 发 送 大 量 的 数据 ， 并 旦 该 端 到 端 
连接 很 少 丢 包 。 在 第 二 种 情况 下 ， 只 用 NAK 的 协议 是 否 会 比 使 用 ACK 的 协议 更 好 ? 为 什么 ? 

PIS. 考虑 显示 在 网 3-17 中 的 网 络 蜂 越 国家 的 例子 。 窗口 长 度 设置 成 多 少时 ， 才 能 使 该 信道 的 利用 
率 超过 90% ? 假设 分 组 的 长 度 为 1300 字 节 (包括 首部 字段 和 数据 ) 

假设 某 应 用 使 用 rda. 0 作为 其 运输 层 协 以 。 因 为 停 等 协议 具有 非常 低 的 信道 利用 率 (显示 在 网 络 路 
越 国家 的 例子 中 ) ， 该 应 用 程序 的 设计 者 让 接收 方 持续 回 送 许 多 (大 于 2) 交替 的 ACK 0 Al ACK 1, 
即使 对 应 的 数据 未 到 达 接 收 方 。 这 个 应 用 程序 设计 将 能 增加 信道 利用 率 吗 ? 为 什么 ”该 方法 存在 某 
种 潜在 的 问题 吗 ? 试 解释 之 ， 

矢 虑 两 个 网 络 实体 A MB, 它们 由 一 条 完善 的 双向 信道 所 连接 ( 即 任 何 发 送 的 报 文 将 正确 地 收 到 ; 
信道 将 不 会 损坏 、 丢 失 或 重 排序 分 组 )。A 和 B 将 以 交互 的 方式 彼此 交付 报 文 : 首先 ，A 必须 向 B 
交付 一 个 报 文 ，B 然后 必须 向 A 交付 一 个 报 文 ， 接 下 来 A 必须 向 B 交付 一 个 报 文 ， 等 等 。 如 果 一 个 
实体 处 于 它 不 试图 向 男 一 侧 交 付 报 文 的 状态 ， 将 存在 一 个 来 自 上 层 的 类 似 于 rdt_send( data) 调用 的 
事件 ， 它 试图 向 下 传送 数据 以 向 男 一 侧 传 输 ， 来自 上 层 的 该 调用 能 够 直接 忽略 对 于 rdt_unable_to_ 
send( data) 调用， 这 通知 较 高 层 当 前 不 能 够 发 送 数 据 。[ 注意 : 做 出 这 种 简化 的 假设 ， 使 你 不 必 担 心 
缓存 数据 .] 

对 该 协议 画 出 FSM 说 明 (一 个 FSM 用 于 A, 一 个 FSM HF B). 注意 你 不 必 担 心 这 里 的 可 靠 性 
机 制 ， 该 问题 的 要 点 在 于 创建 反映 这 两 个 实体 的 同步 行为 的 FSM 说 明 。 应 当 使 用 与 图 3-9 中 协议 
rdtl. 0 有 相同 含义 的 下 列 事件 和 动作 : rdt_send( data) packet = make_pkt( data), udt__send( data) , 
rdt_rev( packet) extract( packet ,data) ，deliver_data( data) 。 保 证 你 的 协议 反映 了 A 和 B 之 间 发 送 的 
严格 交 蔡 。 还 要 保证 在 你 的 FSM 描述 中 指出 A 和 8 昌 的 初始 状态 。 

在 3.4.4 WFR IME AY ARE SR 协议 中 ， 只 要 报 文 可 用 ( 如果 报 文 在 窗口 中 ) ， 发 送 方 就 会 不 等 待 
确认 而 传输 报 文 。 假 设 现在 我 们 要 求 一 个 SR 协议 ,一 次 发 出 一 对 报 文 ， 而 且 只 有 在 知道 第 一 对 报 
文中 的 两 个 报 文 都 正确 到 达 后 才 发 送 第 二 对 报 文 。 

假设 该 信道 中 可 能 会 丢失 报 文 ， 但 报 文 不 会 发 生 损坏 和 失 序 。 试 为 报 文 的 单 向 可 靠 传输 而 设计 
一 个 差错 控制 协议 。 画 出 发 送 方 和 接收 方 的 FSM 描述 。 描 述 在 发 送 方 和 接收 方 之 间 黄 个 方向 发 送 的 
报 文 格式 。 如 果 你 使 用 了 不 同 于 3.4 节 (例如 udt_send( ) , start_timer( )、rdt_rev( ) 等 ) 中 的 任何 
其 他 过 程 雷 有 用， 详细 地 阐述 这 些 动作 。 举 例 说 明 (用 发 送 方 和 接收 方 的 时 序 踪迹 图 ) 你 的 协议 是 如 
何 恢复 报 文 丢 失 的 。 
考虑 一 种 情况 ， 主 机 A 想 同时 间 主 机 B 和 主机 C 发 送 分 组 . A BAC 是 经 过 广播 信道 连接 的 ， 即 
H A 发 送 的 分 组 通过 该 信道 传送 到 B A C 假设 连接 A、B 和 C 的 这 个 广播 信道 具有 独立 的 报 文 丢 
失 和 损坏 特性 (例如 ， 从 A 发 出 的 报 文 可 能 被 B 正确 接收 , 但 没有 被 C 正确 接收 )。 设 计 一 个 类 似 
于 停 等 协议 的 差错 控制 协议 ， 用 于 从 A 可 靠 地 传输 分 组 到 B 和 C。 该 协议 使 得 A 直到 得 知 B 和 C 已 
经 正确 接收 到 当前 报 文 ， 才 获取 上 层 交 付 的 新 数据 。 给 出 A 和 C 的 FSM 描述 - (提示 : BAY FSM 大 
体 上 应 当 与 C 的 相同 ,) 同时 ， 给 出 所 使 用 的 报 文 格式 的 描述 。 
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考虑 一 种 主机 A 和 主机 B 要 向 主机 C 发送 报 文 的 情况 。 主 机 A AIC 通过 一 条 报 文 能 够 丢失 和 损坏 (但 不 
重 排 序 ) 的 信道 相连 接 。 主 机 B AIC 由 男 一 条 (与 连接 A 和 C 的 信道 独立 ) 具有 相同 性 质 的 信道 连接 。 
在 主机 C 上 的 运输 层 ， 在 向 上 层 交 付 来 自主 机 A AB 的 报 文 时 应 当 交 替 进 行 〈( 即 它 应 当 首先 交付 来 自 A 
的 分 组 中 的 数据 ， 然 后 是 来 自 B 的 分 组 中 的 数据 ， 等 等 )。 设 计 一 个 类 似 于 停 等 协议 的 差 铺 控制 协议 ， 以 
nib] C 传输 来 日 A ALB 的 分 组 ， 同 时 以 前 面 描述 的 方式 在 C 处 交替 地 交付 ,给 出 A 和 C 的 FSM if 
述 。( 提 示 : BAY PSM 大 体 上 应 当 与 A 的 相同 .) 同时 ,给 出 所 使 用 的 报 文 格式 的 描述 . 


. 假定 我 们 有 两 个 网 络 实体 A 和 B。B 有 一 些 数据 报 文 要 通过 下 列 规则 传 给 A。 当 A 从 其 上 层 得 到 一 


个 请 求 ， 就 从 B 获取 下 一 个 数据 CD) 报 文 。A 必须 通过 A 一 B 信道 向 B 发 送 一 个 请 求 (R) 报 文 。 
M4 B 收 到 一 个 R 报 文 后 ， 它 才 会 通过 B 一 A 信道 向 A 发 送 一 个 数据 (D) HR. A 应 当 准 确 地 将 
每 份 D 报 文 的 副本 交付 给 上 层 。R 报 文 可 能 会 在 A 一 B 信道 中 丢失 (但 不 会 损坏 ); D 报 文 一 旦 发 
出 总 是 能 够 正确 交付 。 两 个 信道 的 时 延 未 知 且 是 变化 的 。 

设计 一 个 协议 (给 出 FSM 描述) ， 它 能 够 综合 适当 的 机 制 ， 以 补偿 会 丢 包 的 A 一 B 信道 ， 并 且 
实现 在 A 实体 中 同上 层 传 递 报 文 。 只 采用 绝对 必要 的 机 制 。 
考虑 一 个 CBN 协议 ， 其 发 送 方 窗口 为 4， 序 号 范围 为 1024， 假设 在 时 刻 上 ， 接 收 方 期 待 的 下 一 个 有 
序 分 组 的 序号 是 上 。 假 设 媒体 不 会 对 报 文 重 新 排序 。 回 答 以 下 问题 : 
a 在 :上 时刻， 发 送 方 窗口 内 的 报 文 序号 可 能 是 多 少 ?” 论证 你 的 回答 ， 
b. 在 上 时刻， 在 当前 传播 回 发 送 方 的 所 有 可 能 报 文 中 ，ACK 字段 的 所 有 可 能 值 是 多 少 ?” 论证 你 的 回答 。 
考虑 CBN 协议 和 SR 协议 。 假 设 序 与 空间 的 长 度 为 上 那么 为 了 避免 出 现 图 3-27 中 的 问题 ， 对 于 这 
两 种 协议 中 的 每 一 种 ， 允 许 的 发 送 方 窗口 最 大 为 多 少 ? 
对 下 面 的 问题 判断 是 非 ， 并 简要 地 证 实 你 的 回答 : 
a. XIF SR 协 以 ， 发 送 方 可 能 会 收 到 落 在 其 当前 窗口 之 外 的 分 组 的 ACK. 
b. 对 于 GBN 协议 ， 发 送 方 可 能 会 收 到 落 在 其 当前 窗口 之 外 的 分 组 的 ACK., 
c、 当 发 送 方 和 接收 方 窗口 长 度 都 为 1 时， 比特 交替 协议 与 SR 协议 相同 。 
d 当 发 送 方 和 接收 方 窗口 长 度 都 为 1 时 ， 比 特 交 替 协 议 与 CBN 协议 相同 . 


. 我 们 曾经 说 过 ， 应 用 程序 可 能 选择 UDP 作为 运输 协议 ， 因 为 UDP 提供 了 ( 比 TCP) 更 好 的 应 用 层 


控制 ， 以 决定 在 报 文 段 中 发 送 什 么 数据 和 发 送 时 机 ， 

a. 应 用 程序 为 什么 对 在 报 文 段 中 发 送 什么 数据 有 更 多 的 控制 ? 

b. 应 用 程序 为 什么 对 何 时 发 送 报 文 段 有 更 多 的 控制 ? 

考虑 从 主机 A 向 主机 B 传输 工 字 节 的 大 文件 ， 假 设 MSS 为 536 字 节 。 

a. 为 了 使 得 TCP 序号 不 至 于 用 完 , LAKES >? 前 面 讲 过 TCP 的 序号 字段 为 4 字 节 。 

b. 对 于 你 在 (a) 中 得 到 的 KL， 求 出 传输 此 文件 要 用 多 长 时 间 ? 假定 运输 层 、 网 络 层 和 数据 链 路 层 
首部 总 共 为 66 字 节 ， 并 加 在 每 个 报 文 段 上 ， 然 后 经 155Mbps 链 路 发 送 得 到 的 分 组 。 忽 略 流 量 控 
制 和 拥塞 控制 ， 使 主机 A 能 够 一 个 接 一 个 和 连续 不 断 地 发 送 这 些 报 文 段 。 

主机 A 和 B 经 一 条 TCP 连接 通信 ， 并 且 主 机 B 已 经 收 到 了 来 和 目 A 的 最 长 为 126 字 节 的 所 有 字 节 。 

假定 主机 A 随后 回 主 机 了 发送 两 个 紧 接 着 的 报 文 段 .第 一 个 和 第 二 个 报 文 段 分 别 包 含 了 80 字 节 和 

40 字 节 的 数据 。 在 第 一 个 报 文 段 中 ,序号 是 127， 源 端口 号 是 302， 目 的 地 端口 号 是 80。 无 论 何 时 

主机 B 接收 到 来 自主 机 A 的 报 文 段 ， 它 都 会 发 送 确 认 。 

a 在 从 主机 A RE B 的 第 二 个 报 文 段 中 , 序号 、 源 端口 号 和 目的 端口 号 各 是 什么 ? 

b 如 果 第 一 个 报 文 段 在 第 二 个 报 文 段 之 前 到 达 ， 在 第 一 个 到 达 报 文 段 的 确认 中 ， 确 认 号 、 源 端口 号 
和 目的 端口 号 各 是 什么 ? 

e 如果 第 二 个 报 文 段 在 第 一 个 报 文 段 之 前 到 达 ， 在 第 一 个 到 达 报 文 段 的 确认 中 ， 确 认 号 是 什么 ? 

. 假定 由 A 发 送 的 两 个 报 文 段 按 序 到 达 B。 第 一 个 确认 丢失 了 而 第 二 个 确认 在 第 一 个 超时 间隔 之 后 
到 达 。 画 出 时 序 图 ， 显 示 这 些 报 文 段 和 发 送 的 所 有 其 他 报 文 段 和 确认 。 (假设 没有 其 他 分 组 丢 
失 -) 对 于 图 上 每 个 报 文 段 ， 标 出 序号 和 数据 的 字 节 数量 ; 对 于 你 增加 的 每 个 应 答 ， 标 出 确认 号 . 
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主机 A 和 B 直接 经 一 条 100Mbps 链 路 连接 。 在 这 两 台 主 机 之 间 有 一 条 TCP 连接 。 主 机 A 经 这 条 连 

接 向 主机 B 发 送 一 个 大 文件 。 主 机 A 能 够 向 它 的 TCP 套 接 字 以 高 达 120Mbps 的 速率 发 送 应 用 数据 ， 

而 主机 B 能 够 以 最 大 50Mbps 的 速率 从 它 的 TCP 接收 缓存 中 读 出 数据 。 描 述 TCP 流量 控制 的 影响 。 

在 3.5.6 节 中 讨论 了 SYN cookie, 

a. 服务 器 在 SYNACK 中 使 用 一 个 特殊 的 初始 序号 ， 这 为 什么 是 必要 的 ? 

b. 假定 某 攻 击 者 得 知 了 一 台 目 标 主机 使 用 了 SYN cookie。 该 攻击 者 能 够 通过 直接 向 目标 发 送 一 个 
ACK 分 组 创建 半 开 或 全 开 连 接 吗 ? 为 什么 ? 

c. 假设 某 攻 击 者 收集 了 由 服务 豆 发 送 的 大 量 初始 序号 。 该 攻击 者 通过 发 送 具 有 初始 序号 的 ACK， 能 
够 引起 服务 部 产生 许多 全 开 连 接 吗 ?为 什么 ? 

考虑 在 3. 6. 1 节 中 显示 在 第 二 种 情况 下 的 网 络 。 假 设 发 送 主 机 A 和 B 具有 某 些 固定 的 超时 值 。 

a. 证 明 增 加 路 由 器 有 限 缓 存 的 长 度 可 能 减 小 吞吐 量 (Aout). 

b. 现在 假设 两 台 主 机 基于 路 由 器 的 缓存 时 延 ， 动 态 地 调整 它们 的 超时 值 ( 像 TCP 所 做 的 那样 ) 。 增 
加 缓存 长 度 将 有 助 于 增加 桔 吐 量 吗 ?为 什么 ? 

假设 测量 的 5 个 SampleRTT 值 ( 2 Wl 3.5.3 47) 是 106ms、120ms、140ms 、90ms 和 115ms。 在 获得 

了 每 个 SampleRTT 值 后 计算 EstimatedRTT, 使 用 a =0. 125 并 旦 假设 在 刚 获得 前 5 个 样本 之 后 Esti- 

matedRTT 的 值 为 100ms。 在 获得 每 个 样本 之 后 ， 也 计算 DevRTT, 假设 B8=0.25， 并 且 假 设 在 刚 获 得 

前 5 个 样本 之 后 DevRTT 的 值 为 5ms。 最 后 ， 在 获得 这 些 样本 之 后 计算 TCP TimeoutInterval . 

考虑 TCP 估计 RTT 的 过 程 。 假 设 w =0. 1， 令 SampleRT, 设置 为 最 新 样本 RTT， 令 SampleRT,, BEY 

下 一 个 最 新 样本 RIT， 等 等 。 

a. 对 于 一 个 给 定 的 TCP 连接 ， 假定 4 个 确认 报 文 相 继 到 达 ， 带 有 4 个 对 应 的 RTT 值 : SampleRT,,, 、 
SampleRT,, . SampleRT p 和 SampleRT,, 。 根 据 这 4 个 样本 RTT 表示 EstimatedRTT。 

b. 将 你 得 到 的 公式 一 般 化 到 个 RIT 样本 的 情况 。 

c 对 于 在 (b) 中 得 到 的 公式 ， 令 n 趋 于 无 穷 。 试 说 明 为 什么 这 个 平均 过 程 被 称 为 指数 移动 平均 。 

在 3.5.3 WP, REINE T TCP 的 往返 时 间 的 估计 。TCP 避免 测量 重 传 报 文 段 的 SampleRTT， 对 此 

你 有 何 看 法 ? 

3.5.4 节 中 的 变量 SendBase 和 3.5.5 节 中 的 变量 LastByteRevd 之 间 有 什么 关系 ? 

3.5.5 节 中 的 变量 LastByteRevd Fil 3.5.4 节 中 的 变量 y 之 间 有 什么 关系 ? 

在 3.5.4 节 中 ,我 们 看 到 TCP 直到 收 到 3 个 宛 余 ACK 才 执 行 快速 重 传 。 你 对 TCP 设计 者 没有 选择 

在 收 到 对 报 文 段 的 第 一 个 元 余 ACK 后 就 快速 重 传 有 何 看 法 ? 

比较 CBN SR 和 TCP (无 延 时 的 ACK)。 假 设 对 所 有 3 个 协议 的 超时 值 足够 长 ， 使 得 5 个 连续 的 数 

据 报 文 段 及 其 对 应 的 ACK 能 够 分 别 由 接收 主机 (主机 B) 和 发 送 主机 〈 主 机 A) 收 到 (WREE 

道中 无 丢失 )。 假设 主机 A 向 主机 B 发 送 5 个 数据 报 文 段 ， 并 且 第 二 个 报 文 段 (从 A 发 送 ) ER. 

最 后 ， 所 有 5 个 数据 报 文 段 已 经 被 主机 B 正确 接收 。 

a 主机 A 总 共 发 送 了 多 少 报 文 段 和 主机 B 总 共 发 送 了 多 少 ACK? 它们 的 序号 是 什么 ”对 所 有 3 个 
协议 回答 这 个 问题 。 

b. 如 果 对 所 有 3 个 协议 超时 值 比 5RTT 长 得 多 ， 则 哪个 协议 在 最 短 的 时 间 间 隔 中 成 功 地 交付 所 有 5 
个 数据 报 文 段 ? 

在 图 3-53 中 的 TCP 描述 中 ， 国 值 ssthresh 的 值 在 几 个 地 方 被 设置 为 ssthresh = cwnd/2， 并 且 当 出 现 

一 个 丢 包 事件 时 ，ssthresh 的 值 被 设置 为 窗口 长 度 的 一 半 。 当 出 现 丢 包 事 件 时 ， 发 送 方 发 送 的 速率 ， 

每 个 RTT 必须 大 约 等 于 cwnd RLR? 解释 你 的 答案 。 如 果 你 的 回答 是 没有 ， 你 能 建议 一 种 不 同 

的 方式 ， 进 行 ssthresh 设置 吗 ? 

考虑 图 3-46b。 如 果 A 和 ,增加 超过 了 RA2，A, 能 够 增加 超过 R/3 吗 ? 试 解释 之 。 现 在 考虑 图 3-46c。 

假定 一 个 分 组 从 路 由 需 到 接收 方 平 均 转 发 两 次 的 话 ， 如 果 Ai 增加 超过 R2, A ,能 够 增加 超过 R/4 

吗 ? 试 解释 之 。 
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P40. 考虑 图 3-$8。 假设 TCP Reno 是 一 个 经 历 如 上 所 示 行 为 的 协议 ， 回 答 下 列 问 题 。 在 各 种 情况 中 ， 简 
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要 地 论证 你 的 回答 。 


拥塞 窗口 长 度 〈 报 文 段 ) 


0 2 4 6 8 10 12 14 16 18 20 22 24 26 


传输 轮回 
图 3-58 TCP 窗口 长 度 作 为 时 间 的 盯 数 
. 指出 TCP 慢 局 动 运行 时 的 时 间 间 陋 . 
b. 指出 TCP 拥 车 避免 运行 时 的 时 间 间 隔 ， 
c 在 第 16 个 传输 轮回 之 后 ， 报 文 段 的 丢失 是 根据 3 个 元 余 ACK 还 是 根据 超时 检测 出 来 的 ? 
. 在 第 22 个 传输 轮回 之 后 ， 报 文 段 的 丢失 是 根据 3 个 元 余 ACK 还 是 根据 超时 检测 出 来 的 ? 
,在 第 1 个 传输 轮回 里 ssthresh 的 初始 值 设 置 为 多 少 ? 
f 在 第 18 个 传输 轮回 里 ssthresh 的 值 设 置 为 多 少 ? 
g. 在 第 24 个 传输 轮回 里 ，ssthresh 的 值 设 置 为 多 少 ? 
. 在 哪个 传输 轮回 内 发 送 第 70 个 报 文 段 ? 
L 假定 在 第 26 个 传输 轮回 后 ， 通 过 收 到 3 个 元 余 ACK 检测 出 有 分 组 丢失 ,拥塞 的 窗口 长 度 和 
ssthresh 的 值 应 当 是 多 少 ? 
j 假定 使 用 TCP Tahoe (而 不 是 TCP Reno), ， 并 假定 在 第 16 个 传输 轮回 收 到 3 个 元 余 ACK。 在 第 19 
个 传输 轮回 ssthresh 和 拥塞 窗口 长 度 是 什么 ? 
. 上 表 次 假设 使 用 TCP Tahoe, Æ$ 22 个 传输 轮回 有 一 个 超时 事件 。 从 第 17 个 传输 轮回 到 第 22 个 传 
输 轮 回 (包括 这 两 个 传输 轮回 ) ,一 共 发 送 了 多 少 分 组 ? 
参考 图 3-56， 该 图 描述 了 TCP 的 AIMD 算法 的 收 钱 特性 。 假 设 TCP 不 采用 乘 性 减 ， 而 是 采用 按 某 一 
第 量 减 小 窗口 。 所 得 的 AAD 算法 将 收敛 于 一 种 平等 共享 算法 吗 ” 使 用 类 似 于 图 3-56 中 的 图 来 证 实 
你 的 结论 。 
在 3.5.4 证 中 ,我们 讨论 了 在 发 生 超时 事件 后 将 超时 间隔 加 倍 。 为 什么 除了 这 种 加 倍 超时 间 隐 机制 
外 ，TCP 还 需要 基于 窗口 的 拥塞 控制 机 制 (如 在 3.7 节 中 学 习 的 那 种 机 制 ) 呢 ? 
主机 A 通过 一 条 TCP 连接 向 主机 B 发 送 一 个 很 大 的 文件 。 在 这 条 连接 上 ， 不 会 出 现任 何 分 组 丢失 和 
EM ae, EELA 与 因特网 连接 链 路 的 传输 速率 表示 为 Rbps。 假 设 主机 A 上 的 进程 能 够 以 S bps 
的 速率 向 TCP 套 接 字 发 送 数 据 ， 其 中 $=10 xR, 进一步 假设 TCP 的 接收 缓存 足够 大 ， 能 够 容纳 整个 
文件 ， 并 且 发 送 缓存 只 能 容纳 这 个 文件 的 百 分 之 一 。 如 何 防止 主机 A 上 的 进程 连续 地 向 TCP 套 接 字 以 速 
48S bps 传送 数据 呢 ? 还 是 用 TCP 流量 控制 呢 ? 还 是 用 TCP 拥塞 控制 ? 或 者 用 其 他 措施 ”阐述 其 理由 。 
考虑 从 一 台 主 机 经 一 条 没有 于 包 的 TCP 连接 向 另 一 台 主 机 发 送 一 个 大 文件 。 
a. 假定 TCP 使 用 不 具有 慢 局 动 的 AIMD 进行 拥塞 控制 。 假设 每 当 收 到 一 批 ACK 时 ，cwnd 增加 1 个 MSS, 
并 且 假 设 往 返 时 间 大 约 恒 定 ，cwnd 从 6MSS 增加 到 12MSS 要 花费 多 长 时 间 (假设 没有 丢 包 事 件 )? 
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b， 对 于 该 连接 ， 到 于 间 =6RTT. 其 平均 吞吐 量 是 多 少 (根据 MSS All RTT)? 

回想 TCP 吞吐 量 的 宏观 描述 在 连接 速率 从 W/(2 x RIT) 变化 到 WRIT 的 周期 内 ， 只 丢失 了 一 个 

分 组 (在 该 周期 的 结束 ). 

a. EHRE EBE (分 组 天 失 的 比率 ) YF: 
Lagi l 
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b， 如 果 一 条 连接 的 于 包 率 为 上 ， 使 用 于 面 的 结果 ， 则 它 的 平均 速率 近似 由 下 式 给 出 : 
1. 22 * MSS 

RTT JL 
考 上 处 仅 有 一 条 单一 的 TCP (Reno) 连接 使 用 一 条 10Mbps frr., 且 该 链 路 没有 缓存 任何 数据 。 假 设 
这 条 链 路 是 发 送 主机 和 接收 主机 之 间 的 唯一 拥 sete 假定 某 TCP 发 送 方向 接收 方 有 一 个 大 文件 要 
发 送 ， 而 接收 方 的 接收 缓存 比 拥塞 窗口 要 大 得 多 . 我 们 也 做 下 列 假设 : 每 个 TCP 报 文 段 长 度 为 1500 
2499; 该 连接 的 双 癌 传播 时 延 是 150ms; 并 且 该 TCP tara 即 忽略 了 慢 启 动 。 


平均 速率 = 


a. 这 条 TCP 连 革 能 够 联 得 的 最 大 窗口 KE (以 报 文 段 计 ) 是 多 少 ? 

b. 这 条 TCP 连接 的 平均 窗口 长 度 (以 报 文 段 计 ) 和 平均 吞吐 量 (以 bps it) 是 多 少 ? 

c 这 条 TCP 连接 在 从 天 包 恢 复 后 ， 盏 次 到 达 其 最 大 窗口 要 经 历 多 长 时 间 ? 

考虑 在 前 面 习题 中 所 摘 述 的 场景 .假设 10Mbps 链 路 能 够 缓存 有 限 个 报 文 段 。 试 论证 为 了 使 该 链 路 
总 是 忙于 发 送 数据 ， 我 们 将 要 选择 缓存 长 度 ， 使 得 其 至 少 为 发 送 方 和 接收 方 之 间 链 路 速率 C 与 双 回 


传播 时 延 之 积 

重复 习题 46， 但 用 一 条 10Gbps 链 路 代替 10Mbps 链 路 。 注 意 到 在 对 < 部 分 的 答案 中 ， 应 当 认 识 到 在 

从 于 包 恢 复 后 ， 拥 寒窗 口 长 度 到 达 最 大 窗口 长 度 将 需要 很 长 时 间 。 给 出 解决 该 问题 的 基本 思路 。 

AT (用 RIT 度量 ) 表示 一 条 TCP 连接 将 拥塞 窗口 从 W/2 增加 到 中 所 需 的 时 间 间 隔 ， 其 中 WW 是 最 

大 的 拥塞 窗口 长 度 . 论证 了 是 TCP 平均 吞吐 量 的 函数 . 

考虑 一 种 简化 的 TCP 的 AIMD 算法 ， 其 中 拥塞 窗口 长 度 用 报 文 段 的 数量 来 度量 ， 而 不 是 用 字 节 度 
E. EIEH, A RTT 拥塞 窗口 长 度 增加 一 个 报 文 段 。 在 乘 性 减 中 ， 拥 塞 窗 口 长 度 减 小 一 半 
(如 果 结 果 不 是 一 个 整数 ， 向 下 取 整 到 最 近 的 整数 ) 。 假 设 两 条 TCP 连接 Cl 和 C2， 人 它们 共享 一 条 速 

率 为 每 秒 30 个 报 文 段 的 单一 拥塞 链 路 。 假 设 Cl 和 C2 均 处 于 拥塞 避免 阶段 。 连 接 Cl 的 RTT 是 

50ms ， 连 接 C2 的 RTT 是 100ms。 假设 当 链 路 中 的 数据 速率 超过 了 链 路 的 速率 时 ， 所 有 TCP 连接 经 

受 数据 报 文 段 丢失 -。 

a WERTZ to, Cl 和 C2 具有 10 个 报 文 段 的 拥塞 窗口 ， 在 1000ms 后 它们 的 拥塞 窗口 为 多 长 ? 

b. 经 长 时 间 运 行 ， 这 两 条 连接 将 取得 共享 该 拥塞 链 路 的 相同 的 带宽 吗 ? 


. 考虑 在 前 面 习题 中 描述 的 网 络 。 现 在 假设 两 条 TCP 连接 Cl 和 C2， 它 们 具有 相同 的 100ms RTT, f 


设 在 时 刻 ty, Cl 的 拥塞 窗口 长 度 为 15 个 报 文 段 ， 而 C2 的 拥塞 窗口 长 度 是 10 个 报 文 段 
a. 在 2200ms 后 ,它们 的 拥塞 窗口 长 度 为 多 长 ? 
b. 经 长 时 间 运 行 ， 这 两 条 连接 将 取得 共享 该 拥 紧 链 路 的 相同 的 融 宽 吗 ? 
E E 并 在 相同 时 间 达 到 它们 的 最 小 窗口 长 度 ， 
”我 们 说 这 两 条 连接 是 同步 的 。 经 长 时 间 运 行 ， 这 两 条 连接 将 最 终 变 得 同步 吗 ? 如 果 是 ， 它 们 的 最 
大 窗口 长 度 是 多 少 ? 
d 这 种 同步 将 有 助 于 改善 共享 链 路 的 利用 率 吗 ”为 什么 ”给 出 打破 这 种 同步 的 某 种 思路 。 
考虑 修改 TCP 的 拥塞 控制 算法 。 不 使 用 加 性 增 ， 使 用 乘 性 增 : 无 论 何 时 某 TCP 收 到 一 个 合法 的 
ACK， 就 将 其 窗口 长 度 增加 一 个 小 正 数 a (0<a<1)- 求 出 竺 包 率 上 和 最 大 拥塞 窗口 克之 间 的 另 数 
RA. 论证: 对 于 这 种 修正 的 TCP， Jere TCP 的 平均 吞吐 量 如 何 ， 一 条 TCP 连接 将 其 拥塞 窗口 长 度 
从 W/2 增加 到 下 ， 总 是 需要 相同 的 时 间 ， 
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P53. 在 3.7 节 对 TCP 未 来 的 讨论 中 , 我 们 注意 到 为 了 取得 10Gbps 的 吞吐 量 ，TCP (HEAR 2 x 10 AY FRC 
BERR (或 等 价 为 每 000 000 000 个 报 文 段 有 一 个 丢 包 事件 ) 。 给 出 针对 3.7 节 中 给 定 的 RIT 和 
MSS 值 的 对 2 x 10-" 值 的 推导 。 如 果 TCP 需要 支持 一 条 100Gbps 的 连接 ， 所 能 容忍 的 丢 包 率 是 多 少 ? 

P54. 在 3.7 节 中 对 TCP 拥塞 控制 的 讨论 中 ,我 们 隐 含 地 假定 TCP 发 送 方 总 是 有 数据 要 发 送 。 现 在 考虑 下 
列 情况 ， 某 TCP 发 送 方 发 送 大 量 数据 ， 然 后 在 tt 时 刻 变 得 空闲 〈 因 为 它 没有 更 多 的 数据 要 发 送 ) 。 
TCP 在 相对 长 的 时 间 内 保持 空间 ， 然 后 在 六 时 刻 要 发 送 更 多 的 数据 。 当 TCP Æ n 开始 发 送 数 据 时 ， 
让 它 使 用 在 4 时 刻 的 cwnd 和 ssthresh 值 ， 将 有 什么 样 的 优点 和 缺点 ? 你 建议 使 用 什么 样 的 方法 ”为 
什么 ? 

P55. 在 这 个 习题 中 我 们 研究 是 否 UDP 或 TCP 提供 了 某 种 程度 的 端点 鉴别 。 

a 考虑 一 台 服 务 器 接收 到 在 一 个 UDP 分 组 中 的 请 求 并 对 该 请 求 进行 响应 (例如 ， 如 由 DNS 服务 咒 
所 做 的 那样 ) 。 如 果 一 个 具有 IP 地 址 X 的 客户 用 地 址 Y ITERE, A SS RE e (oy Ab AK E 
的 响应 ? 

b. 假定 一 台 服 务 器 接收 到 具有 IP 源 地 址 Y 的 一 个 SYN， 在 用 SYNACK 响应 之 后 ， 接 收 一 个 具有 IP 
源 地 址 Y 和 正确 确认 号 的 ACK。 假 设 该 服务 器 选择 了 一 个 随机 初始 序号 并 且 没 有 “中 间 人 ”， 该 
服务 器 能 够 确定 该 客户 的 确 位 于 Y 吗 ? (并 且 不 在 某 个 其 他 哄骗 为 Y 的 地 址 X。) 

P56. 在 这 个 习题 中 ,我 们 考虑 由 TCP 慢 启 动 阶段 引入 的 时 延 。 考 虑 一 个 客户 和 一 个 Web 服务 器 直接 连 
接 到 速率 RR 的 一 条 链 路 。 假 定 该 客户 要 取 回 一 个 对 象 ， 其 长 度 正好 等 于 15S$5， 其 中 5 是 最 大 段 长 度 
( MSS) 。 客 户 和 服务 器 之 间 的 往返 时 间 表 示 为 RIT (假设 为 常数 )。 忽 略 协议 首部 ， 确 定 在 下 列 情 
况 下 取 回 该 对 象 的 时 间 (包括 TCP 连接 创建 ) : 

a. 4S/R > S/R + RTT >2S/R 

b. S/R + RTT >4S/R 

c. S/R > RTT 
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实现 一 个 可 靠 运 输 协议 

在 这 个 编程 作业 实验 中 ， 你 将 要 编写 发 送 和 接收 运输 层 的 代码 ， 以 实现 一 个 简单 的 可 靠 数据 运输 协 
议 。 这 个 实验 有 两 个 版 本 ， 即 比特 交替 协议 版 本 和 GBN 版 本 。 这 个 实验 应 当 是 有 趣 的 ， 因 为 你 的 实现 将 
与 实际 情况 下 所 要 求 的 差异 很 小 。 

因为 可 能 没有 你 能 够 修改 其 操作 系统 的 独立 机 器 ， 你 的 代码 将 不 得 不 在 模拟 的 硬件 /软件 环境 中 执行 。 
然而 ， 为 你 提供 例 程 的 编程 接口 〈 即 从 上 层 和 下 层 调用 你 的 实体 的 代码 ) ， 非 常 类 似 于 在 实际 UNIX 环境 中 
做 那些 事情 的 接口 。 (实际 上 ， 在 本 编程 作业 中 描述 的 软件 接口 比 起 许多 教科 书 中 描述 的 无 限 循环 的 发 送 
方 和 接收 方 要 真实 得 多 。) 停止 和 启动 定时 器 也 是 模拟 的 ， 定 时 器 中 断 将 激活 你 的 定时 需 处 理 例 程 。 
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在 这 个 实验 中 ， 你 将 使 用 Web 浏览 器 访问 来 自 某 Web 服务 器 的 一 个 文件 。 如 同 在 前 面 的 Wireshark 
实验 中 一 样 ， 你 将 使 用 Wireshark 来 俘获 到 达 你 计算 机 的 分 组 。 与 前 面 实 验 不 同 的 是 ， 你 也 能 够 从 该 Web 
服务 器 下 载 一 个 Wireshark 可 读 的 分 组 踪迹 ,记载 你 从 服务 器 下 载 文件 的 过 程 。 在 这 个 服务 更 踪迹 文件 
里 ， 你 将 发 现 自己 访问 该 Web 服务 器 所 产生 的 分 组 。 你 将 分 析 客 户 端 和 服务 器 端 踊 迹 文件 ， 以 探究 TCP 
的 方方面面 。 特 别 是 你 将 评估 在 你 的 计算 机 与 该 Web 服务 器 之 间 TCP 连接 的 性 能 。 你 将 跟踪 TCP 窗口 行 
为 、 推 断 分 组 丢失 、 重 传 、 流 控 和 拥塞 控制 行为 并 佑 计 往 返 时 间 。 

与 所 有 的 Wireshark 实验 一 样 ， 该 实验 的 全 面 描 述 能 够 在 本 书 Web 站 点 http: //www. awl. com/kurose- 
ross 上 找到 。 
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制 | Wireshark 实验 ， 探究 UDP 

在 这 个 简短 实验 中 ， 你 将 进行 分 组 俘获 并 分 析 那 些 使 用 UDP 的 你 喜爱 的 应 用 程序 〈 例 如 ，DNS 或 如 
Skype 这 样 的 多 媒体 应 用 ) 。 如 我 们 在 3. 3 节 中 所 学 的 那样 ，UDP 是 一 种 简单 的 、 不 提供 不 必要 服务 的 运 
输 协议 。 在 这 个 实验 中 ， 你 将 研究 在 UDP 报 文 段 中 的 各 首部 字段 以 及 检验 和 计算 。 

与 所 有 的 Wireshark 实验 一 样 ， 该 实验 的 全 面 描述 能 够 在 本 书 Web 站 点 http: //www. awl. com/kurose- 
ross 上 找到 ， 

Van Jacobson 现在 是 PARC 的 高 级 研究 员 - 在 此 之 前 ， 他 是 分 组 设计 
(Packet Design) 组 织 的 首席 科学 家 和 共同 创建 者 、 再 往 前 ， 他 是 思科 公司 的 首 
席 科 学 家 ,在 加 入 思科 之 前 ， 他 是 劳 伦 兹 伯克利 国家 实验 室 的 网 络 研究 组 的 负 
责 人 ， 并 在 加 州 大 学 伯克利 分 校 和 斯 坦 福 大 学 任教 。 Van 于 2001 年 因 其 在 通信 
网 络 领域 的 贡献 而 获得 ACM SIGCOMM 终身 成 就 奖 ， 于 2002 年 因 其 “对 网 络 拥 
塞 的 理解 和 成 功 研制 用 于 因特网 的 拥塞 控制 机 制 ” 而 获得 IEEE Kobayashi % . 
他 于 2004 年 当选 为 美国 国家 工程 院 院 士 








Van Jacobson 

o 请 描述 在 你 的 职业 生涯 中 从 事 的 一 个 或 两 个 最 为 令 人 兴奋 的 项 目 。 工 作 中 最 

大 的 挑战 是 什么 ? 

学 校 教会 我 们 许多 寻找 答案 的 方式 。 在 每 个 我 致力 于 的 感 兴趣 的 问题 中 ， 艰 巨 的 任务 是 找到 正确 的 
问题 。 “4 Mike Karels 和 我 开始 关注 TCP 拥塞 时 ， 我 们 花费 数 月 凝视 协议 和 分 组 踪迹 ， 询 问 “ 为 什么 它 会 
失效 ?”。 有 一 天 在 Mike 的 办 公 室 ， 我们 中 的 一 个 说 : “我 匹 法 弄 明 白 它 失效 的 原因 是 因为 我 不 理解 它 究 
竞 如 何 开 始 运 转 的 ”这 导致 提出 了 一 个 正确 问题 ， 它 迫使 我 们 弄 明 白 使 TCP 运转 的 “ack 计时 ”。 从 那 
以 后 ， 其 他 东西 就 容易 了 。 

© 从 更 为 一 般 意义 讲 ， 您 认为 网 络 和 因特网 未 来 将 回 何 处 去 ” 

对 于 大 多 数 人 来 说 ，Web ZAM. Mik, Marna ke eae, AAR Ae Web 是 一 个 
运行 在 因特网 上 的 应 用 程序 ， 但 要 是 以 上 说 法 正确 又 该 如 何 呢 ? 因特网 使 得 主机 对 之 间 能 够 进行 交谈 。 
Web 用 于 分 布 信息 的 生产 和 消耗 “信息 传播 ”是 一 种 非常 一 般 意义 上 的 通信 ， 而 “成 对 交谈 ”只 是 其 
中 一 个 极 小 的 子 集 。 我 们 需要 向 更 大 的 范围 进发 。 今天 的 网 络 以 点 到 点 连 线 的 方式 处 理 广 播 媒体 (无线 
电 、PON 等 )。 那 是 极为 低 效 的 。 经 过 指头 敲 击 或 智能 手机 ,遍及 全 世界 的 每 秒 兆 兆 (10°) 比特 的 数据 
正在 交换 ， 但 我 们 不 知道 如 何 将 其 作为 “网 络 ” 处 理 。ISP 正在 忙于 建立 缓存 和 CDN， 以 可 扩展 地 分 发 
视频 和 音频 。 组 存 是 该 解决 方案 的 必要 部 分 ， 但 今天 的 网 络 缺乏 这 个 部 分 。 从 信息 论 、 排 队 论 或 流量 理 
论 直 到 因特网 协议 规范 ， 都 告诉 我 们 如 何 建造 和 部 署 它 .我 认为 并 硕 望 在 未 来 几 年 中 ， 网 络 将 演化 为 包 
含 多 得 多 的 通信 愿景， 支撑 Web 的 运行 。 

© 什么 人 给 你 的 职业 市 来 灵感 ? 

当 我 还 在 研究 生 院 时 ，Richard Feynman 访问 了 学 校 并 做 了 学 术 报 告 ， 他 讲 到 了 一 些 量子 理论 知识 ， 
使 我 整 学 期 都 在 努力 理解 该 理论 ， 他 的 解释 非常 简单 和 明白 易 懂 ， 使 得 那些 对 我 而 言 难 以 理解 的 东西 变 
得 显而易见 和 不 可 避免 。 领 会 和 表达 复杂 世界 背后 的 简单 性 的 能 力 是 给 我 的 罕见 和 绝妙 的 礼物 。 

© 对 于 希望 从 事 计算 机 科学 和 网 络 的 学 生 ， 您 的 建议 是 什么 ? 

网 络 是 奇妙 的 领域 ,计算 机 和 网 络 对 社会 的 影响 ,也许 比 自 有 文字 记载 以 来 的 任何 发 明 都 大 。 网 络 
本 质 上 是 有 关连 接 的 东西 ， 研 究 它 有 助 于 你 进行 智能 连接 : 蚁 群 搜索 和 蜜蜂 舞蹈 显示 了 协议 设计 好 于 
RFC, 流量 拥挤 或 人 们 离开 挤 满 人 的 体育 馆 是 拥塞 的 要 素 ， 在 感恩 节 暴 风 雪 后 寻找 航班 返回 学 校 的 学 生 
们 是 动态 路 由 选择 的 核心 。 如 果 你 对 许多 东西 感 兴趣 ， 并 且 要 对 此 干 点 事 ， 很 难 想象 还 有 什么 比 网 络 更 
好 的 领域 了 。 
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在 前 一 章 中 我 们 学 习 了 运输 层 依赖 于 网 络 层 的 主机 到 主机 的 通信 和 服务， 提供 各 种 形式 
的 进程 到 进程 的 通信 。 我 们 也 学 习 了 运输 层 工作 时 不 有 具备 任何 有 关 网 络 层 实际 实现 这 种 服 
务 的 知识 。 因 此 也 许 你 现在 想 知道 ， 这 种 主机 到 主机 通信 服务 的 直 实 情况 是 什么 ”是 什么 
使 得 它 工 作 起 来 的 呢 ? 

在 本 草 中 我 们 将 学 习 网 络 层 实 际 是 怎样 实现 主机 到 主机 的 通信 服务 的 。 我 们 将 看 到 ， 
与 运输 层 和 应 用 层 不 同 的 是 ， 在 网 络 中 的 每 一 台 主 机 和 路 由 需 中 都 有 一 个 网 络 层 部 分 。 正 
因 如 此 ， 网 络 层 协议 是 协议 栈 中 最 具 挑 战 性 〈 因 而 也 是 最 有 趣 ) 的 部 分 。 

网 络 层 也 是 协议 栈 中 最 复杂 的 层次 之 一 ， 因 此 我 们 将 在 这 里 涉及 大 量 的 知识 。 我 们 的 
学 习 从 网 络 层 的 概述 和 它 能 够 提供 的 服务 开始 。 我 们 将 仔细 考察 两 种 用 于 构造 网 络 层 分 组 
交付 的 方法 ， 即 数据 报 模式 和 虚 电 路 模式 ， 并 且 理 解 编 址 在 传递 分 组 到 目的 主机 所 起 的 重 
要 作用 。 

在 本 草 中 ， 我 们 将 对 网 络 层 的 转发 (forwarding) 功能 和 路 由 选择 (routing) 功能 做 重 
要 区 分 。 转 发 涉及 分 组 在 单一 的 路 由 天 中 从 一 条 人 链 路 到 一 条 出 链 路 的 传送 。 路 由 选择 涉 
及 一 个 网 络 的 所 有 路 由 器 ， 它 们 经 路 由 选择 协议 共同 交互 ， 以 决定 分 组 从 源 到 目的 地 结 点 
所 采用 的 路 径 。 当 你 继续 本 章 学 习 时 ， 心 中 要 记 住 这 个 区 别 。 

为 了 加 深 对 分 组 转发 的 理解 ， 我 们 将 “进入 ”路 由 需 内 部 来 观察 它 的 硬件 体系 结构 和 
组 织 。 接 下 来 我 们 将 观察 在 因特网 中 的 分 组 转发 ， 以 及 令 人 称颂 的 网 际 协议 CIP). FR 
将 研究 网 络 层 编 址 和 IPv4 的 数据 报 格式 。 然 后 我 们 将 探讨 网 络 地 址 转换 (NAT) 、 数 据 报 
分 段 、 因 特 网 控制 报 文 协议 (ICMP) 和 IPv6。 

然后 我 们 将 注意 力 转 回 网 络 层 的 路 由 选择 功能 。 我 们 将 看 到 路 由 选择 算法 的 任务 是 决 
定 从 发 送 方 到 接收 方 的 好 的 路 径 〈 等 价 地 为 路 由 ) 。 我 们 将 首先 学 习 路 由 选择 算法 的 理论 ， 
关注 两 种 最 为 流行 的 算法 类 型 : 链 路 状态 和 距离 矢量 算法 。 因 为 路 由 选择 算法 的 复杂 性 随 
着 网 络 路 由 带 数 量 的 增加 会 有 相当 大 的 增长 ， 因 此 我 们 也 会 关注 等 级 制 路 由 选择 方法 。 当 
我 们 涉及 因特网 的 自治 系统 内 部 的 路 由 选择 协议 (RIP, OSPF 和 IS-IS) 和 因特网 的 自治 
系统 之 间 的 路 由 选择 协议 (BCP) 时 ， 我 们 将 看 到 理论 是 如 何 付 诸 实践 的 。 最 后 我 们 讨论 
广播 和 多 播 路 由 选择 

总 的 来 说 ， 本 草 有 3 个 主要 部 分 : 第 一 部 分 (4.1 节 和 4.2 市 ) 涉及 了 网 络 层 功 能 和 
服务 ; 第 二 部 分 (4.3 7744.4 7) 涉及 了 转发 ; 最 后 第 三 部 分 (4.5 节 到 4.7 节 ) 涉及 
了 路 由 选择 。 

4.1 概述 

图 4-1 显示 了 一 个 具有 H1 和 H2 两 台 主 机 和 在 Hl 与 H2 之 间 的 路 径 上 有 几 台 路 由 可 
的 简单 网 络 。 假 设 Hl 正在 回 H2 发 送信 息 ， 考 虑 这 些 主 机 与 中 间 路 由 需 的 网 络 层 所 起 的 
作用 。H1 中 的 网 络 层 取得 来 目 于 Hl 运输 层 的 报 文 段 ， 将 每 个 报 文 段 封 装 成 一 个 数据 报 
( 即 一 个 网 络 层 的 分 组 ) ， 然 后 将 该 数据 报 向 相 邻 路 由 器 RI 发 送 。 在 接收 方 主机 H2， 网 络 
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层 接 收 来 自 相 邻 路 由 带 R2 的 数据 报 ， 提 取出 运输 层 报 文 段 ， 并 将 其 问 上 交付 给 H2 的 运 
输 层 。 路 由 顺 的 主要 作用 便 是 将 数据 报 从 和 人 链 路 转发 到 出 链 路 。 注 意 到 网 4-1 中 所 示 路 由 
内 具有 截断 的 协议 栈 ， 即 没有 网 络 层 以 上 的 部 分 ， 因 为 〈 除 了 控制 目的 外 ) BR RAIS íT 
我 们 在 第 2 、3 章 学 习 过 的 应 用 层 和 运输 层 协议 。 
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公司 网 络 


图 4-1 网 络 层 


4. 1.1 转发 和 路 由 选择 


网 络 层 的 作用 从 表面 上 看 极为 向 单 ， 即 将 分 组 从 一 人 台 发 送 主机 移动 到 一 人 台 接 收 主机 。 
为 此 ， 需 要 两 种 重要 的 网 络 层 功 能 : 
© 转发 。 当 一 个 分 组 到 达 路 由 带 的 一 条 输入 链 路 时 ， 路 由 带 必 须 将 该 分 组 移动 到 适 
当 的 输出 链 路 。 例 如 ， 来 目 主 机 Hl PAHARI 的 一 个 分 组 ， 必 须 回 在 H2 ta 
上 的 下 一 台 路 由 需 转 发 。 在 4.3 市 中 ,我 们 将 深入 路 由 带 内 部 观察 ， 考 察 分 组 在 
路 由 需 中 是 如 何 实际 从 一 条 输入 链 路 转发 到 一 条 输出 链 路 的 。 
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e 路 由 选择 。 当 分 组 从 发 送 方 流向 接收 方 时 ， 网 络 层 必须 决定 这 些 分 组 所 采用 的 路 
由 或 路 径 。 计 算 这 些 路 径 的 算法 被 称 为 路 由 选择 算法 (routing algorithm), 。 例 如 ， 
一 个 路 由 选择 算法 将 决定 分 组 从 Hl 到 H2 流动 所 遵循 的 路 径 。 

在 讨论 网 络 层 时 ， 许 多 作者 经 滑 互 换 地 使 用 转发 和 路 由 选择 这 两 个 术语 。 我 们 在 本 书 
中 将 更 为 精确 地 使 用 这 些 术 语 。 转 发 是 指 将 分 组 从 一 个 输入 链 路 接口 转移 到 适当 的 输出 链 
路 接口 的 路 由 天 本 地 动作 。 路 由 选择 是 指 网 络 范围 的 过 程 ， 以 决定 分 组 从 源 到 目的 地 所 采 
取 的 端 到 端 路 径 。 用 驾驶 的 例子 进行 类 比 ， 考 虑 在 1.3.1 市 中 旅行 者 所 历经 的 从 宾 夕 法 尼 
亚 州 到 佛罗里达 州 的 行程 。 在 这 个 行程 中 ， 该 驾驶 员 到 佛罗里达 州 经 过 了 途中 的 许多 立交 
桥 。 我 们 能 够 认为 转发 就 像 通过 单个 立交 桥 的 过 程 : 一 辆 汽车 沿 道 路 上 进入 立交 桥 的 一 个 
入 口 ， 并 且 决 定 应 当 走 哪 条 路 来 离开 该 立交 桥 。 我 们 能 够 认为 路 由 选择 是 规划 从 费城 到 佛 
罗 里 达州 行程 的 过 程 : 在 着 手 行程 之 前 ， 罗 驶 员 查 阅 地 图 并 在 许多 可 能 的 路 径 中 选择 一 
条 ， 其 中 每 条 路 径 都 由 一 系列 经 立交 桥 连接 的 路 段 组 成 。 

每 台 路 由 器 具有 一 张 转发 表 (forwarding table) 。 路 由 需 通 过 检查 到 达 分 组 盲 部 字段 的 
值 来 转发 分 组 ， 然 后 使 用 该 值 在 该 路 由 带 的 转发 表 中 索引 查询 。 和 存储 在 转发 表 项 中 的 该 自 
部 的 值 指 出 了 该 分 组 将 被 转发 的 路 由 颖 的 输出 链 路 接口 。 分 组 首部 中 的 该 值 可 能 是 该 分 组 
的 目的 地 址 或 该 分 组 所 属 连接 的 指示 ， 这 取决 于 网 络 层 协议 。 图 4-2 提供 了 一 个 例子 。 在 
图 4-2 中 ， 一 个 首部 字段 值 为 0111 的 分 组 到 达 路 由 器 。 路 由 器 在 它 的 转发 表 中 索引 ， 决 
定 该 分 组 的 输出 链 路 接口 是 接口 2。 然后 路 由 天 在 内 部 将 该 分 组 转发 到 接口 2。 在 4.3 市 
中 我 们 深 入 路 由 融 内 部 ， 更 为 详细 地 人 研究 这 种 转发 功能 。 


| 首部 值 “| 输出 链 路 | 





在 到 达 分 组 
的 首部 中 的 值 





图 4-2 路 由 选择 算法 决定 转发 表 中 的 值 

你 也 许 现 在 想 知 道路 由 器 中 的 转发 表 是 如 何 配置 的 。 这 是 一 个 关键 问题 ， 它 揭示 了 路 

由 选择 和 转发 间 的 重要 相互 作用 关系 。 如 图 4-2 中 所 示 ， 路 由 选择 算法 决定 了 插入 路 由 器 
的 转发 表 中 的 值 。 路 由 选择 算法 可 能 是 集中 式 的 〈 例 如 ， 算 法 在 某 个 中 心 场 点 执行 ， 并 回 
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每 台 路 由 器 下 载 路 由 选择 信息 ) ， 或 是 分 布 式 的 〈 即 ， 使 用 运行 在 每 台 路 由 硕 上 的 分 布 式 
路 由 选择 算法 的 一 部 分 ) 。 在 任何 一 种 情况 下 ， 都 是 路 由 器 接收 路 巾 选择 协议 报 文 ， 该 信 
息 被 用 于 配置 其 转发 表 。 通 过 考虑 网 络 中 的 一 种 假想 情况 〈 不 真实 的 ， 但 技术 上 是 可 行 
的 ) ， 其 中 所 有 的 转发 表 是 由 人 类 网 络 操作 员 直 接 配 置 而 在 路 由 需 中 物理 地 存在 ， 转 发 和 
路 由 选择 功能 的 区 别 和 不 同 能 被 进一步 说 明 。 在 这 种 情况 下 ， 不 需要 任何 路 由 选择 协议 ! 
当然 ， 该 人 类 操作 员 将 需要 彼此 交互 ， 以 确保 该 转发 表 配置 得 能 使 分 组 到 达 它 们 想 要 到 达 
的 目的 地 。 也 很 可 能 出 现下 列 现象 : 人 工 配置 更 容易 出 错 ， 并 且 对 于 网 络 拓扑 的 变化 ， 响 
应 起 来 比 路 由 选择 协议 慢 。 因 此 ， 我 们 庆幸 所 有 网 络 具 有 转发 和 路 由 选择 功能 。 

当 我 们 讨论 术语 时 ， 需 要 指出 经 稼 交互 使 用 的 两 个 其 他 术语 ， 而 我 们 将 要 更 为 小 心地 
使 用 它们 。 我 们 将 约定 术语 分 组 交换 机 是 指 一 台 通 用 分 组 交换 设备 ， 它 根据 分 组 首部 字段 
中 的 值 ， 从 输入 链 路 接口 到 输出 链 路 接口 转移 分 组 。 有 某 些 分 组 交换 机 称 为 链 路 层 交 换 机 
(link-layer switches) (在 第 5 章 仔细 学 习 ) ， 基 于 链 路 层 字 段 中 的 值 做 转发 决定 。 其 他 分 
组 交换 机 称 为 路 由 器 (router) ， 基 于 网 络 层 字 段 中 的 值 做 转发 决定 。( 为 了 全 面 理解 这 种 
重要 区 别 ， 你 可 能 要 回顾 1.5.2 节 ， 在 那里 我 们 讨论 了 网 络 层 数据 报 和 链 路 层 帧 及 其 关 
A.) 市 场 销售 资料 经 常 将 具有 以 太 网 接口 的 路 由 器 称 为 “三 层 交 换 机 ”， 但 它们 实际 上 
是 三 层 设 备 ， 混 消 了 相关 概念 。 因 为 在 本 章 中 我 们 关注 的 是 网 络 层 ， 所 以 我 们 使 用 术语 
由 器 代替 分 组 交换 机 。 当 我 们 谈论 虚 电 路 网 络 中 的 分 组 交换 机 时 ,我们 其 至 将 使 用 词汇 路 
由 器 (很 快 将 讨论 )。 

连接 建立 

我 们 刚才 说 过 网 络 层 有 两 个 重要 的 功能 ， 转 发 和 路 由 选择 。 但 我 们 很 快 将 看 到 在 某 些 
计算 机 网 络 中 ， 实 际 上 有 第 三 种 重要 的 网 络 功能 ， 即 连接 建立 (connection setup), 。 回 想 
我 们 学 习 TCP 时 ， 当 数据 能 从 发 送 方 流 癌 接收 方 之 前 ,需要 三 次 握手 。 这 允许 发 送 方 和 接 
收 方 建立 所 需 的 状态 信息 (例如 ， 序 号 和 初始 流 控 制 窗口 长 度 )。 以 类 似 的 方式 ， 某 些 网 
络 层 体系 结构 如 ATM, WPH, MPLS (我 们 将 在 5.8 市 学 习 )， 要 求 从 源 到 目的 地 沿 着 所 
选择 的 路 径 彼此 握手 ， 以 便 在 给 定 源 到 目的 地 连接 中 的 网 络 层 数据 分 组 能 够 开始 流动 之 前 
建立 起 状态 。 在 网 络 层 ， 该 过 程 被 称 为 连接 建立 。 我 们 将 在 4. 2 节 中 仔细 学 习 连 接 建 立 。 


4.1.2 网 络 服务 模型 


在 钻研 网 络 层 之 前 ， 我 们 将 以 开阔 的 视野 来 考虑 网 络 层 可 能 提供 的 不 同类 型 的 服务 。 
当 位 于 发 送 主机 的 运输 层 向 网 络 传输 分 组 时 〈( 即 在 发 送 主机 中 将 分 组 向 下 交 给 网 络 层 ) ， 
运输 层 能 够 指望 网 络 层 将 该 分 组 交付 给 目的 地 吗 ? 当 发 送 多 个 分 组 时 ， 它 们 会 按 发 送 顺序 
按 序 交 付 给 接收 主机 的 运输 层 吗 ?发送 两 个 连续 分 组 的 时 间 间 隅 与 接收 到 这 两 个 分 组 的 时 
间 间 隔 相 同 吗 ? 网 络 层 会 提供 关于 网 络 中 拥塞 的 反馈 信息 吗 ? 在 发 送 主机 与 接收 主机 中 连 
接 运输 层 的 通道 的 抽象 视图 (特性 ) 是 什么 ”对 这 些 问 题 和 其 他 问题 的 答案 由 网 络 层 提供 
的 服务 模型 所 确定 。 网 络 服 务 模型 (network service model) 定义 了 分 组 在 发 送 与 接收 病 系 
统 之 间 的 端 到 端 运输 特性 。 

我 们 现在 考虑 网 络 层 能 够 提供 的 某 些 可 能 的 服务 。 在 发 送 主机 中 ， 当 运输 层 回 网 络 层 
传递 一 个 分 组 时 ， 能 由 网 络 层 提 供 的 特定 服务 包括 

© 确保 交付 。 该 服务 确保 分 组 将 最 终 到 达 其 目的 地 。 
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e 有 具有 时 延 上 界 的 确保 交付 。 该 服务 不 仅 确保 分 组 的 交付 ， 而 且 在 特定 的 主机 到 主 
ALIN RE LYRA (fae 100ms 内 ) 交付 。 

此 外 ， 能 够 为 给 定 的 源 和 目的 地 之 间 的 分 组 流 提供 下 列 服务 : 

© 有 序 分 组 交付 。 该 服务 确保 分 组 以 它们 发 送 的 顺序 到 达 目 的 地 。 

e 确保 最 小 带宽 。 这 种 网 络 层 服务 模仿 在 发 送 和 接收 主机 之 间 的 一 条 特定 比特 率 
(例如 1Mbps) 的 传输 链 路 的 行为 。 只 要 发 送 主机 以 低 于 特定 比特 率 的 速率 传输 比 
E 〈 作 为 分 组 的 组 成 部 分 ) ， 则 分 组 不 会 丢失 ， 且 每 个 分 组 会 在 预定 的 主机 到 主机 
时 延 内 到 达 〈 例 如 在 40ms 内 ) 。 

e 确保 最 大 时 延 持 动 。 该 服务 确保 位 于 发 送 方 的 两 个 相继 分 组 之 间 的 时 间 量 等 于 在 
目的 地 接收 到 它们 之 间 的 时 间 量 (或 这 种 间隔 的 变化 不 超过 某 些 特定 的 值 ) 。 

e 安全 性 服务 。 使 用 仅 由 源 和 目的 主机 所 知晓 的 一 个 秘密 会 话 密 钥 ， 在 源 主机 中 的 网 络 
层 能 够 加 密 向 目的 主机 发 送 的 所 有 数据 报 负载 。 在 目的 主机 中 的 网 络 层 则 能 够 负责 
密 该 负载 。 使 用 这 种 服务 ， 能 够 回 源 和 目的 主机 之 间 的 所 有 运输 层 报 文 段 (TCP 和 
UDP) 提供 机 密 性 。 除 了 机 密 性 以 外 ， 网 络 层 能 够 提供 数据 完整 性 和 源 鉴别 服务 。 

这 只 是 网 络 层 能 够 提供 的 部 分 服务 的 列表 ， 有 无 数 种 可 能 的 服务 变种 。 

因特网 的 网 络 层 提供 了 单一 的 服务 ， 称 为 尽力 而 为 服务 (best-effort service), MÆ 4-1 

看 ， 尽 力 而 为 服务 看 起 来 是 根本 无 服务 的 一 种 委 娆 说 法 。 使 用 尽力 而 为 服务 ， 分 组 间 的 定 
时 是 不 能 确保 被 保证 的 ， 分 组 接收 的 顺序 也 不 能 保证 与 发 送 的 顺序 一 致 ， 传 送 的 分 组 也 不 
能 保证 最 终 交 付 。 给 出 这 样 的 定义 ,一 个 没有 问 目 的 地 交付 分 组 的 网 络 也 符合 尽力 而 为 交 
付 服 务 的 定义 。 人 然而， 如 我 们 很 快要 讨论 的 那样 ， 这 样 一 种 极为 简化 的 网 络 层 服务 模型 ， 
是 有 其 正当 的 存在 理由 的 。 

表 4-1 因特网 、ATM CBR 和 ATM ABR 服务 模型 


无 











网 络 体系 结构 





















尽力 而 为 任何 可 能 的 顺序 | 不 维护 “| 无 
CBR 保证 恒定 速率 维护 不 出 现 拥塞 









不 维护 提供 拥塞 指示 





ABR 保证 最 小 速率 





其 他 的 网 络 体系 结构 已 定义 和 实现 了 许多 超过 因特网 的 尽力 而 为 服务 的 服务 模型 。 例 
Wn, ATM 网 络 体系 结构 | MFA Forum 2012; Black 1995] 提供 了 多 重 服 务 模 型 HRA 
以 在 相同 的 网 络 中 为 不 同 的 连接 提供 不 同类 别 的 服务 。ATM 网 络 怎样 提供 这 种 服务 的 讨 
论 已 经 超出 了 本 书 的 范围 ; 我 们 这 里 的 目的 仅 是 注意 到 除了 因特网 的 尽力 而 为 模型 外 ， 还 
存在 其 他 模型 即 可 。 两 个 最 重要 的 ATM 服务 模型 是 恒定 比特 率 和 可 用 比特 率 服务 : 

。 恒定 比特 率 (Constant Bit Rate, CBR) ATM 网 络 服务 。 这 是 第 一 个 和 被 标准 化 的 

ATM 服务 模型 ， 它 反映 了 电话 公司 对 ATM 的 早期 兴趣 ， 以 及 CBR 服务 在 承载 实 
时 、 恒 定 比 特 率 的 音频 和 视频 流量 方面 的 适用 性 。CBR 服务 的 目标 从 概念 上 讲 是 
简单 的 ， 就 是 使 网 络 连接 看 起 来 就 像 在 发 送 与 接收 主机 之 间 存 在 一 条 专用 的 、 固 
定 带宽 的 传输 链 路 ， 以 使 用 性 质 相 同 的 虚拟 管道 来 提供 分 组 (ATM 术语 称 为 信 
JG) 流 。 使 用 CBR 服务 ，ATM 信 元 流 以 如 下 方式 被 承载 路 越 网 络 ， 即 一 个 信 元 的 
端 到 端 时 延 、 信 元 端 到 端 时 延 中 的 可 变性 〈 即 时 延 拌 动 ) 及 丢失 或 推迟 交付 的 信 
元 的 比率 都 确保 在 特定 值 以 下 。 当 第 一 次 建立 CBR 连接 时 ， 发 送 主机 与 ATM 网 
络 认 可 了 这 些 值 。 
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。 AAE (Available Bit Rate, ABR) ATM 网 络 服务 。 由 于 因特网 提供 了 所 谓 的 
尽力 而 为 服务 ，ATM 的 ABR 也 许 最 好 被 刻画 为 比 尽力 而 为 服务 稍 好 一 点 的 服务 。 
与 因特网 服务 模型 一 样 ，ABR 服务 下 的 信 元 也 许 会 丢失。 然而 与 因特网 不 同 的 是 ， 
信 元 不 能 被 重 排序 (虽然 它们 可 能 丢失 ) ， 对 于 使 用 ABR 服务 的 连接 来 说 ， 最 小 
信 元 传输 速率 (MCR) 是 可 以 得 到 保证 的 。 如 果 在 给 定时 间 内 网 络 有 足够 的 空闲 
资源 ， 发 送 方 也 可 以 用 比 MCR 更 高 的 速率 成 功 地 发 送 数 据 。 另 外 ， 如 我 们 在 3.6 
方 中 所 见 ，ATM ABR 服务 能 够 为 发 送 方 提 供 反 馈 信 息 (利用 一 个 拥塞 通知 比特 ， 
或 一 个 明确 的 速率 发 送 )， 以 便 控制 发 送 方 在 MCR 和 一 个 允许 的 峰值 信 元 速率 之 
间 调 整 其 速率 . 


4.2 虚 电 路 和 数据 报 网 络 


回想 第 3 草 ， 运 输 层 能 够 为 应 用 程序 提供 无 连接 服务 或 面 癌 连接 服务 。 例 如 ， 因 特 网 的 
运输 层 为 每 个 应 用 程序 在 两 种 服务 间 提 供 了 选择 : UDP， 一 种 无 连接 服务 ; 或 TCP， 一 种 面 
问 连接 服务 。 以 类 似 的 方式 ， 网 络 层 也 能 够 在 两 台 主 机 之 间 提 供 无 连接 服务 或 连接 服务 。 网 
络 层 的 连接 和 无 连接 服务 在 许多 方面 与 运输 层 的 面向 连接 和 无 连接 服务 类 似 。 例 如 ， 网 络 层 
连接 服务 以 源 和 目的 主机 间 的 握手 开始 ; 网 络 层 无 连接 服务 则 没有 任何 握手 预备 步 又。 

尽管 网 络 层 连接 和 无 连接 服务 与 运输 层面 向 连接 和 无 连接 服务 有 类 似 之 处 ， 但 也 存在 

© 在 网 络 层 中 ， 这 些 服务 是 由 网 络 层 回 运输 层 提供 的 主机 到 主机 的 服务 。 在 运输 层 

中 ， 这 些 服务 则 是 运输 层 回 应 用 层 提供 的 进程 到 进程 的 服务 - 

。 在 至 今 为 止 的 所 有 主要 的 计算 机 网 络 体 系 结构 中 (因特网 、ATM 、 帆 中 继 等 ) ， 网 
络 层 或 者 提供 了 主机 到 主机 的 无 连接 服务 ， 或 者 提供 了 主机 到 主机 的 连接 服务 ， 
而 不 同时 提供 这 两 种 服务 。 仅 在 网 络 层 提供 连接 服务 的 计算 机 网 络 称 为 虚 电 路 
( Virtual-Circuit, VC) 网 络 ; 仅 在 网 络 层 提供 无 连接 服务 的 计算 机 网 络 称 为 数据 
报 网 络 (datagram network ) 。 

。 在 运输 层 实 现 面 问 连接 的 服务 与 在 网 络 层 实现 连接 服务 是 根本 不 同 的 。 我 们 在 前 
面 一 草 看 到 ， 运 输 层 面向 连接 服务 是 在 位 于 网 络 边缘 的 端 系统 中 实现 的 ; 我 们 很 
快 看 到 ， 网 络 层 连接 服务 除了 在 端 系统 中 ， 也 在 位 于 网 络 核 心 的 路 由 带 中 实现 ， 

虚 电 路 网 络 和 数据 报 网 络 是 计算 机 网 络 的 两 种 基本 类 型 。 在 作出 转发 决定 时 ， 它 们 使 
用 了 非常 不 同 的 信息 。 我 们 现在 仔细 观察 一 下 它们 的 实现 。 


4.2.1 虚 电路 网 络 


虽然 因特网 是 一 个 数据 报 网 络 ， 但 许多 其 他 网 络 体系 结构 〈 包 括 ATM 、 帧 中 继 的 体 
系 结构 ) 却 是 虚 电路 网 络 ， 因 此 在 网 络 层 使 用 连接 。 这 些 网 络 层 连接 被 称 为 虚 电 路 。 我 们 
现在 考虑 在 计算 机 网 络 中 是 如 何 实现 虚 电 路 服务 的 ， 

一 条 虚 电 路 的 组 成 如 下 : (D 源 和 目的 主机 之 间 的 路 径 ( 即 一 系列 链 路 和 路 由 器 ) ; 
QVC 号 ， 沿 着 该 路 径 的 每 段 链 路 的 一 个 号 码 ; 他 沿 着 该 路 径 的 每 台 路 由 器 中 的 转发 表 表 
项 。 属 于 一 条 虚 电路 的 分 组 将 在 它 的 首部 携带 一 个 VC 号 。 因 为 一 条 虚 电 路 在 每 条 链 路 上 
可 能 具有 不 同 的 VC 号 ， 每 台中 间 路 由 化 必须 用 一 个 新 的 VC 号 替代 每 个 传输 分 组 的 VC 
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号 。 该 新 的 VC 号 从 转发 表 获 得 。 

为 了 举例 说 明 这 个 概念 ， 考 虑 在 图 4-3 中 的 网 络 。 在 图 4-3 中 靠近 RI 链 路 的 号 码 是 
该 链 路 接口 的 编号 。 现 在 假定 主机 A 请 求 该 网 络 在 它 自己 与 主机 B 之 间 创 建 一 条 虚 电路 。 
同时 假定 该 网 络 为 该 虚 电 路 选择 路 径 A-Rl- A RI R2 B 
R2-B 并 为 这 条 路 径 上 的 这 3 条 链 路 分 配 PN 3 PS 
VC 号 12、22 和 32。 在 这 种 情况 下 ， 当 在 
这 条 虚 电 路 中 的 分 组 离开 主机 A 时 ， 在 该 
分 组 首部 中 的 VC 字段 的 值 是 12; 当 它 离 
JF RI 时 ， 该 值 是 22， 而 当 它 离开 R2 时 ， 
该 值 是 32. 图 4-3 一 个 简单 的 虚 电 路 网 络 

对 于 通过 采 路 由 硕 的 分 组 ， 该 路 由 硕 怎 样 决定 更 换 其 VC 号 呢 ?” 对 于 虚 电 路 网 络 ， 每 
台 路 由 融 的 转发 表 包 括 了 VC 号 的 转换 ; 例如 ， 在 R1 中 的 转发 表 可 能 有 些 像 下 表 : 





入 接口 入 VC 号 出 接口 出 VC 号 


A | wi Nj] = 
| 
| 
ee 


无 论 何 时 跨越 一 台 路 巾 希 创建 一 条 新 的 虚 电 路 ， 转 发 表 就 增加 了 一 个 新 表 项 。 类 似 
地 ， 无 论 何 时 终止 一 条 虚 电路 ， 治 着 该 路 径 每 个 表 中 的 相应 项 将 被 删除 。 

你 也 许 想 知道 一 个 分 组 沿 着 其 路 由 在 每 条 链 路 上 不 简单 地 保持 相同 的 VC 号 的 原因 . 
答案 包括 两 方面 。 第 一 ， 逐 链 路 代替 该 号 码 减 少 了 在 分 组 首部 中 VC 字段 的 长 度 。 第 二 方 
面 更 为 重要 ， 通 过 允许 沿 着 该 虚 电 路 路 径 每 条 链 路 有 一 个 不 同 的 VC 号 ,大 大 人 简化 了 虚 电 
路 的 建立 。 特 别 是 ， 在 具有 多 个 VC 号 的 路 径 ， 其 上 的 每 条 链 路 能 够 独立 于 沿 着 该 路 径 的 
其 他 链 踏 所 选 的 号 码 选择 一 个 VC 号 。 如 果 沿 着 某 路 径 的 所 有 链 路 要 求 一 个 共同 的 VC 号 
的 话 ， 路 由 硕 将 不 得 不 交换 并 处 理 相 当 大 量 的 报 文 ， 以 约定 一 个 共同 的 VC 号 (例如 ， — 
个 并 未 由 这 些 路 由 需 的 任何 其 他 现 有 虚 电路 使 用 的 号 码 ) 用 于 一 次 连接 。 

在 虚 电 路 网 络 中 ， 该 网 络 的 路 由 融 必 须 为 进行 中 的 连接 维持 连接 状态 信息 (connec- 
tion state information ) 。 特 别 是， 每 当 跨 越 一 台 路 由 器 创建 一 个 新 连接 ， 必 须 在 该 路 由 器 的 
转发 表 中 增加 一 个 新 的 连接 项 ; 每 当 释放 一 个 连接 ， 必 须 从 该 表 中 删除 该 项 。 值 得 注意 的 
是 ， 即 使 没有 VC 号 转换 ， 仍 有 必要 维持 连接 状态 信息 ， 该 信息 将 VC 号 与 输出 接口 号 联 
系 起 来 。 路 由 兰 是 否 对 每 条 进行 中 的 连接 维持 连接 状态 信息 是 一 个 关键 性 问题 ， 我 们 在 本 
书 中 将 再 次 讨论 该 问题 。 

在 虚 电 路 中 有 3 个 明显 不 同 的 阶段 : 

e 虚 电 路 建立 。 在 建立 阶段 ， 发 送 运 输 层 与 网 络 层 联系 ， 指 定 接 收 方 地 址 ， 等 待 网 

络 建 立 虚 电路 。 网 络 层 决定 发 送 方 与 接收 方 之 间 的 路 径 ， 即 该 虚 电 路 的 所 有 分 组 
要 通过 的 一 系列 链 路 与 路 由 需 。 网 络 层 也 为 沿 着 该 路 径 的 每 条 链 路 决定 一 个 VC 
写 。 最 后 ， 网 络 层 在 沿 看 路 径 的 每 台 路 由 右 的 转发 表 中 增加 一 个 表 项 。 在 虚 电 路 
建立 期 间 ， 网 络 层 还 可 以 预 留 该 虚 电 路 路 径 上 的 资源 ( 如 带宽 )。 
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e 数据 传送 。 如 图 4-4 中 所 示 ， 一 旦 创建 了 虚 电 路 ， 分 组 就 可 以 开始 沿 该 虚 电 路 流 
动 卫 . 







i 4. 呼 叫 连接 3. 接 受 呼 叫 
ERE 5. 数据 流 开始 6. 接 收 数据 





图 4-4 虚 电 路 建立 


e 虚 电 路 拆除 ， 当 发 送 方 (或 接收 方 ) 通知 网 络 层 它 希 望 终 止 该 虚 电 路 时 ， 就 启动 
这 个 阶段 。 然后 网 络 层 通常 将 通知 网 络 另 一 侧 的 端 系统 结束 呼叫 ， 并 更 新 路 径 上 
每 台 分 组 路 由 器 中 的 转发 表 以 表明 该 虚 电 路 已 不 存在 了 。 

在 网 络 层 的 虚 电 路 建立 与 运输 层 的 连接 建立 (例如 我 们 在 第 3 章 学 习 的 TCP 三 次 握 
手 ) 之 间 有 一 个 细微 但 很 重要 的 区 别 。 运 输 层 的 连接 建立 仅 涉 及 两 个 端 系统 。 在 运输 层 的 
连接 建立 期 间 ， 两 个 端 系统 独自 决定 运输 层 连接 的 参数 ( 如 初始 序号 与 流量 控制 窗口 长 
度 ) 。 虽 然 这 两 个 端 系统 已 经 知道 该 运输 层 连接 ， 但 网 络 中 的 路 由 器 则 对 这 些 完 全 不 知情 。 
在 另 一 方面 ， 对 于 一 个 虚 电 路 网 络 层 ， 沿 两 个 端 系统 之 间 路 径 上 的 路 由 器 都 要 参与 虚 电 路 
的 建立 ， 且 每 台 路 由 器 都 完全 知道 经 过 它 的 所 有 虚 电 路 。 

闪 系 统 回 网 络 发 送 指示 虚 电 路 启动 与 终止 的 报 文 ， 以 及 路 由 器 之 间 传 递 的 用 于 建立 
虚 电 路 ( 即 修改 路 由 惕 表 中 的 连接 状态 ) WR, ERATE SH (signaling mes- 
sage) ， 用 来 交换 这 些 报 文 的 协议 常 称 为 信 令 协议 (signaling protocol)。 虚 电路 建立 如 
图 4-4 所 示 。 在 本 书 中 我 们 将 不 涉及 虚 电 路 信 令 协议 ; 有 关 面 回 连接 网 络 中信 令 的 一 般 
讨论 参见 [Black 1997] ， 有 关 ATM 的 Q. 2931 信 令 协议 的 规范 参见 [ITU-T Q. 2931 
1995 ] 。 


4.2.2 数据 报 网 络 


在 数据 报 网 络 中 ， 每 当 一 个 端 系统 要 发 送 分 组 ， 它 就 为 该 分 组 加 上 目的 端 系统 的 地 
址 ， 然 后 将 分 组 推进 网 络 中 。 如 图 4-5 中 所 示 ， 无 需 建 立 任何 虚 电 路 ， 路 由 器 不 维护 任何 
虚 电 路 的 状态 信息 〈 因 为 没有 虚 电路 !) 。 

当 分 组 从 源 到 目的 地 传输 ， 它 通过 一 系列 路 由 需 传 递 。 这 些 路 由 融 中 的 每 台 都 使 用 分 
组 的 目的 地 址 来 转发 该 分 组 。 特 别 是 ， 每 人 台 路 由 磺 有 一 个 将 目的 地 址 映射 到 链 路 接口 的 转 
发 表 ; 当 分 组 到 达 路 由 硕 时 ， 路 由 需 使 用 该 分 组 的 目的 地 址 在 转发 表 中 查找 适当 的 输出 链 
路 接口 。 然 后 路 由 做 有 意 将 分 组 癌 该 输出 链 路 接口 转发 . 

为 了 进一步 深入 理解 查找 操作 ， 我 们 看 一 个 特定 的 例子 。 假 定 所 有 的 目的 地 地 址 均 是 
32 比特 (这 恰好 就 是 在 下 数据 报 中 目的 地 址 的 长 度 )。 转 发 表 的 蛮 力 实现 将 对 每 个 可 能 
的 目的 地 址 有 一 个 表 项 。 因 为 有 超过 40 亿 个 可 能 的 地 址 ， 这 种 选择 完全 是 不 可 能 的 。 
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图 4-5 数据 报 网 络 
现在 我 们 进一步 假设 路 由 器 有 4 条 链 路 ， 编 号 0 ~3， 分 组 以 如 下 方式 转发 到 链 路 


接口 ， 
目的 地 址 范 链 路 接口 
11001000 00010111 00010000 00000000 
到 0 


11001000 00010111 00010111 11111111 
11001000 00010111 00011000 00000000 

到 l 
11001000 00010111 00011000 11111111 


11001000 00010111 00011001 00000000 


到 2 
11001000 00010111 00011111 11111111 
其 他 3 


显然 ， 对 于 这 个 例子 ， 在 路 由 句 的 转发 表 中 就 没有 必要 有 40 亿 表 项 。 例 如 ， 我 们 能 
够 有 仅 包 括 4 个 表 项 的 下 列 转发 表 : 
前 级 匹配 链 路 接口 
11001000 00010111 00010 
11001000 00010111 00011000 
11001000 00010111 00011 
其 他 
使 用 这 种 风格 的 转发 表 ， 路 由 器 用 分 组 的 目的 地 址 的 前 缀 (prefix) 与 该 表 中 的 表 项 
进行 匹配 ; 如 果 存 在 一 个 匹配 项 ， 则 路 由 器 癌 与 该 匹配 项 相 联 系 的 链 路 转发 分 组 。 例 如 ， 
假设 分 组 的 目的 地 址 是 11001000 00010111 00010110 10100001; 因为 该 地 址 的 21 比特 前 级 
匹配 该 表 的 第 一 项 ， 所 以 路 由 需 问 链 路 接口 0 转发 该 分 组 。 如 果 一 个 前 缀 不 匹配 前 3 项 中 
的 任何 一 项 ， 则 路 由 需 回 链 路 接口 3 转发 该 分 组 。 尽 管 听 起 来 足够 简单 ， 但 这 里 还 是 有 重 
要 的 微妙 之 处 。 你 可 能 已 经 注意 到 一 个 目的 地 址 可 能 与 不 止 一 个 表 项 相 匹 配 。 例 如 ， 地 址 
11001000 00010111 00010000 10101010 的 前 24 比特 与 表 中 的 第 二 项 匹配 ， 而 该 地 址 的 前 
21 比特 与 表 中 的 第 三 项 匹配 。 当 有 多 个 匹配 时 ， 该 路 由 需 使 用 最 长 前 缀 匹配 规则 (longest 
prefix matching rule) ;， 即 在 该 表 中 寻找 最 长 的 匹配 项 ， 并 加 与 最 长 前 组 匹配 相关 联 的 链 路 
接口 转发 分 组 。 当 我 们 在 4. 4 节 中 详细 学 习 因 特 网 编 址 时 ,我们 将 完全 明白 使 用 这 种 最 长 
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前 级 匹配 规则 的 理由 ， 

虽然 在 数据 报 网 络 中 的 路 由 奋 不 维持 连接 状态 信息 ， 但 它们 无 论 如 何在 其 转发 表 中 维 
持 了 转发 状态 信息 。 然 而 ， 转 发 状态 信息 表 变 化 的 时 间 斥 度 相 对 要 慢 。 实 际 上 ， 在 数据 报 
网 络 中 的 转发 表征 通过 路 由 选择 算法 进行 修改 的 ， 这 通 第 每 1 ~5 分 钟 左右 更 新 一 次 转发 
Ko 在 虚 电 路 网 络 中 ， 无 论 何 时 通过 路 由 需 建 立 一 条 新 的 连接 ， 或 无 论 何 时 通过 路 由 器 拆 
除 一 条 现 有 的 连接 ， 路 由 硕 中 的 转发 表 就 被 更 新 。 对 一 台 第 一 层 主 干 路 由 融 而 言 ， 这 很 容 
Sy VA id BP AS EF TE] JN EHET E r 
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送 一 系列 分 组 可 能 在 通过 网 络 时 走 不 同 的 路 径 ， 并 可 能 无 序 到 达 。 | Paxson 1997] 和 
| Jaiswal 2003 | 对 公共 因特网 上 的 分 组 重 排 序 和 其 他 现象 进行 了 了 有趣 的 测量 研究 。 


4.2.3 虚 电 路 和 数据 报 网 络 的 由 来 


数据 报 与 虚 电 路 网 络 的 演化 反映 了 它们 的 由 来 ， 作 为 一 条 重要 的 组 织 原则 ， 虚 电路 的 
邮 念 来 源 于 电话 界 ， 它 采用 了 真正 的 电路 。 由 于 呼叫 建立 及 每 呼叫 的 状态 要 在 网 络 中 的 路 
由 吉 上 维持 ， 一 个 面向 虚 电 路 的 网 络 显然 比 数据 报 网 络 要 复杂 得 多 (对 于 电路 交换 与 分 组 
交换 网 络 的 复杂 性 的 有 趣 比 较 可 参看 [| Molinero- Fernandez 2002 ] ) 。 这 也 与 它 的 电话 传统 
一 致 。 电 话 网 络 在 网 络 中 必然 有 其 复杂 性 ， 因 为 它们 要 连接 哑 端 系统 设备 ， 如 转盘 电话 。 
( 对 于 很 年 轻 的 人 来 说 可 能 不 知道 转盘 电话 为 何 物 ， 这 是 一 种 无 按键 、 仅 有 一 个 拨号 盘 的 
模拟 电话 ,) 

男 一 方面 ， 因 特 网 作为 一 种 数据 报 网 络 ， 是 由 将 计算 机 连接 在 一 起 的 需求 发 展 而 来 
的 。 由 于 端 系统 设备 复杂 得 多 ， 因 特 网 架构 师 们 选择 使 网 络 层 服务 模型 尽 可 能 简单 。 如 我 
们 在 第 2、3 章 中 所 见 ， 另 外 的 功能 〈 例 如 ， 按 序 传 送 、 可 靠 数 据 传输 、 拥 塞 控制 与 DNS 
名 字 解 析 ) 在 端 系 统 中 的 更 高 层 实 现 。 这 正好 与 电话 网 模型 相反 ， 并 产生 了 一 些 有 趣 的 
结果 。 

e 由 于 所 产生 的 因特网 服务 模型 使 服务 保证 最 少 (没有 !)， 它 对 网 络 层 施 加 了 最 小 

限度 的 需求 。 这 使 得 互联 使 用 各 种 不 同 链 路 层 技术 而 且 具 有 十 分 不 同 的 传输 速率 
和 丢 包 特 性 的 网 络 变 得 更 加 容易 。 这 些 链 路 层 技术 包括 卫星 、 以 太 网 、 光 纤 或 无 
线 。 我 们 将 在 4.4 节 中 详细 地 讨论 IP 网 络 的 互联 。 

e 如 我 们 在 第 2 草 所 见 ， 诸 如 电子 邮件 、Web 等 应 用 ， 甚 至 如 DNS 这 样 的 网 络 基础 
设施 都 是 在 位 于 网 络 边缘 的 主机 CARS ah) 上 实现 的 。 增 加 一 个 新 服务 只 需 连 接 
一 台 主 机 到 网 络 中 ， 并 定义 一 个 新 的 应 用 层 协议 (如 HTTP) 即 可 ， 这 种 能 力 可 
以 使 如 Web 之 类 的 新 服务 能 在 相当 短 的 时 间 内 在 因特网 上 得 以 部 署 。 
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既然 我 们 已 经 概述 了 网 络 层 的 功能 和 服务 ， 我 们 将 注意 力 转向 网 络 层 的 转发 功能 
(forwarding function) ， 即 实际 将 分 组 从 一 人 台 路 由 融 的 人 链 路 传送 到 适当 的 出 链 路 。 我 们 已 
经 在 4.2 中 简要 地 了 解 了 一 些 转发 问题 ， 也 就 是 编 址 和 最 长 前 缀 匹配 问题 。 我 们 以 前 提 
到 过 ， 计 算 机 网 络 研究 人 员 和 从 业 人 员 经 常 互 换 使 用 转发 和 交换 这 两 个 词 ; 在 本 书 中 我 们 
也 将 交互 使 用 这 两 个 词 。 


py 


图 4-6 显示 了 一 个 通用 路 由 右 体 系 结构 的 总 体 视图 。 其 中 标识 了 一 台 路 由 带 的 4 个 组 


成 部 分 。 
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图 4-6 | BATH aI Rt 


输入 端口 。 输 入 端口 执行 几 项 关键 功能 。 它 要 执行 将 一 条 输入 的 物理 链 路 与 路 
由 器 相连 接 的 物理 层 功 能 ， 这 显示 在 图 4-6 中 输入 端口 部 分 最 左 侧 的 方 框 与 输 
出 端口 部 分 最 右 侧 的 方 框 中 。 它 还 要 执行 需要 与 位 于 和 信 链 路 十 端的 数据 链 路 层 
交互 的 数据 链 路 层 功能 ， 这 表示 在 输入 与 输出 端口 部 分 的 中 间 方 框 中 。 也 许 更 
为 重要 的 是 ， 在 输入 端口 还 要 完成 查找 功能 ， 这 显示 在 输入 端口 最 右 侧 的 方 框 
中 。 正 是 在 这 里 ， 通 过 查询 转发 表决 定 路 由 器 的 输出 冰 口 ， 到 达 的 分 组 通过 路 
由 器 的 交换 结构 将 转发 到 输出 端口 。 控 制 分 组 (如 携 寓 路 由 选择 协议 信息 的 分 
组 ) 从 输入 端口 转发 到 路 由 选择 处 理 器 。 注 意 这 里 的 端口 一 词 ， 是 指 中 由 带 的 
物理 输入 和 输出 接口 ， 这 完全 不 同 于 第 2、3 章 中 与 网 络 应 用 程序 和 套 接 字 相 联 
系 的 软件 端口 。 

交换 结构 。 交 换 结构 将 路 由 器 的 输入 端口 与 输出 端口 相连 接 。 这 种 交换 结构 完全 
包含 在 路 由 器 中 ， 即 它 是 一 个 网 络 路 由 融 中 的 网 络 ! 

输出 端口 。 输 出 端口 存储 从 交换 结构 接收 的 分 组 ， 并 通过 执行 必要 的 链 路 层 和 物 
理 层 功 能 在 输入 链 路 上 传输 这 些 分 组 。 当 一 条 链 路 是 双 同 的 ( 即 承 载 两 个 方 回 的 
流量 ) 时 ， 输 出 端口 通常 是 与 该 链 路 的 输入 端口 在 同一 线路 卡 〈 一 个 包含 一 个 或 
多 个 输入 端口 的 印刷 电路 ， 它 与 交换 结构 相连 ) 上 成 对 出 现 的 。 

路 由 选择 处 理 器 。 路 由 选择 处 理 占 执行 路 由 选择 协议 (我 们 将 在 4.6 市 中 学 习 )， 
维护 路 由 选择 表 以 及 连接 的 链 路 状态 信息 ， 并 为 路 由 需 计 算 转 发 表 。 它 还 执行 网 
络 管理 功能 ， 我 们 将 在 第 9 章 学 : 习 相 关内 容 。 


. 1 节 讲 过 ， 我 们 对 路 由 咒 的 转发 功能 和 路 由 选择 功能 加 以 区 分 。 一 台 路 由 髓 的 输 


输出 端口 和 交换 结构 共同 实现 了 这 种 转发 功能 ， 并 且 总 是 用 硬件 实现 ， 如 图 4-6 


所 示 。 这 些 转发 功能 有 时 总 称 为 路 由 器 转发 平面 (router forwarding plane) 。 为 了 理解 为 何 
需要 硬件 实现 ， 考 虑 具有 10Gbps 带宽 的 输入 链 路 和 64 字 节 的 下 数据 报 ， 其 输入 端口 在 万 
一 个 数据 报到 达 前 仅 有 51. 2ns 来 处 理 数据 报 。 如 果 N 个 端口 结合 在 一 块 线路 卡 上 (因为 
实践 中 常常 这 样 做 ) ， 数 据 报 处 理 流水 线 必须 以 NN 售 速 率 运 行 ， 这 远 快 过 软件 实现 的 速率 。 
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转发 平面 便 件 既 能 够 使 用 广 商 目 己 的 硬件 设计 来 实现 ， 也 能 够 使 用 购买 的 商用 硅 世 片 ( 例 
如 英特尔 和 Broadcom 公司 所 出 售 的 ) 来 实现 。 

当 转 发 平面 以 纳 秒 时 间 斥 度 运 行 时 ， 路 由 器 的 控制 功能 〈( 即 执行 路 由 选择 协议 、 对 上 
线 或 下 线 的 连接 链 路 进行 啊 应 ， 以 及 执行 如 我 们 将 在 第 9 章 中 学 习 的 管理 功能 ) ， 在 毫秒 
或 秒 时 间 尺 度 上 运行 。 这 些 路 由 器 控制 平面 (router control plane) 通常 用 软件 实现 并 在 路 
由 选择 处 理 副 上 执行 (通常 是 一 种 传统 的 CPU ) 。 

在 深入 探讨 路 由 带 的 控制 和 数据 平面 的 细节 之 前 ,我们 转向 4. 1.1 节 中 的 类 比 ， 其 中 
分 组 转发 好 比 汽 车 进入 和 离开 立交 桥 。 假 定 立 交 桥 是 环 状 交 叉 路 ， 在 汽车 进入 该 环 状 交 义 
路 前 ， 需 要 做 一 点 处 理 ， 即 汽车 停 在 一 个 人 口 站 上 并 指示 它 的 最 终 目 的 地 (并 非 在 本 地 环 
状 交 又 路 ， 而 是 其 旅途 的 最 终 目 的 地 )。 入 口 站 的 一 名 服务 人 员 查 找 最 终日 的 地 ， 决定 通 
问 最 后 目的 地 的 环 状 交 叉 路 的 出 口 ， 并 告诉 驾驶 员 要 走 哪 个 出 口 。 该 汽车 进入 环 状 交 叉 路 
(该 环 状 交叉 路 可 能 挤 满 了 从 其 他 输入 道路 进入 的 其 他 汽车 ， 朝 着 其 他 环 状 交 义 路 出 口 前 
进 ) ， 并 且 最 终 离 开 预 定 的 环 状 交叉 路 出 口 斜 道 ， 在 这 里 可 能 遇 到 了 在 该 出 口 离开 环 状 交 
叉 路 的 其 他 汽车 。 

在 这 个 类 比 中 ， 我 们 能 够 识别 图 4-6 中 的 最 重要 的 路 由 器 组 件 ， 即 人 口 路 和 入 口 站 对 
应 于 输入 端口 (具有 查找 功能 以 决定 本 地 输出 端口 ); 环 状 交叉 路 对 应 于 交换 结构 ; 环 状 
交叉 路 出 口 路 对 应 于 输出 端口 。 依 助 于 这 个 类 比 ， 考 虑 瓶颈 可 能 出 现 的 地 方 是 有 益 的 。 如 
果 汽 车 以 极 快 的 速率 到 达 〈 例 如， 该 环 状 交叉 路 位 于 德国 或 意大利 !) 而 车 站 服务 人 员 很 
慢 ， 将 发 生 什么 情况 ? 这 些 服务 人 员 必 须 工作 得 多 快 ， 以 确保 在 人 口 路 上 没有 车 辆 拥堵 ? 
甚至 对 于 极 快 的 服务 人 员 ， 如 果 汽 车 在 环 状 交叉 路 上 开 得 很 慢 ， 将 发 生 什 么 情况 ? 拥堵 仍 
会 出 现 吗 ?如 果 大 多 数 进入 的 汽车 都 要 在 相同 的 出 口 斜 道 离开 环 状 交叉 路 ， 将 发 生 什么 情 
况 ? 在 出 口 糙 道 或 别 的 什么 地 方 会 出 现 拥堵 吗 ? 如 果 我 们 要 为 不 同 的 汽车 分 配 优先 权 ， 或 
先行 阻挡 某 些 汽车 进入 环 状 交叉 路 ， 环 状 交 叉 路 将 如 何 运 行 ? 这 些 全 都 与 路 由 器 和 交换 机 
设计 者 面 对 的 问题 形成 类 比 。 

在 下 面 的 各 小 节 中 ， 我 们 将 更 为 详细 地 考察 路 由 顺 功 能 。 [Iyer 2008; Chao 2001; 
Chuang 2005; Turner 1988; McKeown 1997a; Partridge 1998 | 提供 了 对 一 些 特 定 路 由 需 体 
系 结构 的 讨论 。 为 了 具体 起 见 ， 后 继 的 讨论 假定 一 个 数据 报 网 络 中 转发 决定 是 基于 分 组 的 
日 的 地 址 (而 非 虚 电路 网 络 中 的 VC 号 ) 的 。 然 而 ， 对 于 虚 电路 网 络 而 言 ， 概 念 和 技术 是 
相当 类 似 的 。 





Cisco 系统 : 主宰 网 络 的 核心 


在 2012 年 写本 书 时 ，Cisco 公司 雇佣 了 65000 多 人 。 这 个 网 络 公 司 的 巨人 是 如 何 发 
展 起 来 的 呢 ? 它 的 一 切 是 从 1984 年 在 硅谷 公寓 的 一 间 起 居室 里 起 步 的 。 

当 Len Bosak 与 他 的 妻子 Sandy Lerner 在 斯 坦 福 大 学 工作 时 ,他们 就 有 建造 并 出 做 
因特网 路 由 器 给 研究 及 学 术 团 体 的 想法 ， 他们 成 为 那个 时 期 因特网 的 主要 培育 者 。 
Sandy Lerner 起 了 一 个 名 字 Cisco (这 是 旧金山 的 一 种 略称 )， 还 设计 了 公司 的 桥 形 标志 
图 案 。 公 司 总 部 最 初 是 他 们 的 起 居室 ， 而且 刚 开 始 时 他 们 通过 信用 卡 和 夜间 兼职 咨询 工 


EAR A AGRE. FIT 1986 FF RK, Cisco 的 月 收入 达到 了 250 000 美元 到 1987 
年 年 末 ，Cisco 以 1/3 公司 股份 为 交换 条 件 ， 终 于 成 功 吸引 到 了 来 自 Sequoia Capital 的 
200 万 美元 的 风险 投资 。 在 后 来 的 几 年 中 ，Cisco 持续 增长 并 抢占 了 越 来 越 多 的 市 场 份 
额 。 与 此 同时 ，Bosak/Lerner 与 Cisco 管理 层 之 间 的 关系 变 得 紧张 起 来 Cisco 在 1990 年 
公开 发 储 有 股票， 但 在 同年 ，Lerner 与 Bosak 离开 了 公司 . 

多 年 以 来 ，Cisco 在 路 由 器 市 场 之 外 进行 了 成 功 的 扩展 ， 销 售 安 全 、 无 线 缓 存 、 以 
太 网 交换 机 、 数 据 中 心 基础 设施 、 视 频 会 议和 IP 语音 产品 和 服务 ， 然 而 ，Cisco 正面 临 
着 日 益 增 长 的 国际 竞争 ， 包 括 来 自 华 为 (一 个 迅速 增长 的 中 国 网 络 设备 公司 ) 的 竞争 . 
在 路 由 器 和 交换 以 太 网 领域 与 Cisco 竞争 的 公司 包括 Alcatel-Lucent 和 Juniper. 


4.3.1 输入 端口 


图 4-7 中 给 出 一 个 更 详细 的 输入 处 理 的 视 几 .如 前 面 讨 论 的 那样 ， 输 入 交口 的 线路 痛 
接 功 能 与 链 路 层 人 处 理 实现 了 用 于 各 个 输入 链 路 的 物理 层 和 链 路 层 。 在 输入 端口 中 执行 的 查 
找 对 于 路 由 闪 的 运行 是 至 关 重 要 的 。 正 是 在 这 个 地 方 ， 路 由 人 荷 使 用 转 友 表 来 查找 输出 站 
口 ， 使 得 到 达 的 分 组 将 能 经 过 交换 结构 转发 到 该 输出 端口 。 转 发 表 是 由 路 由 选择 处 理 融 计 
算 和 更 新 的 ,但 转发 表 的 一 份 影 子 副本 通常 会 被 存放 在 每 个 输入 端口 。 转 发 表 从 路 由 选择 
处 理 融 经 过 独立 总 线 〈 例 如 一 个 PCI BAe) 复制 到 线路 卡 ， 在 图 4-6 中 该 总 线 由 从 路 由 选 
择 处 理 需 到 和 输入 线路 卡 的 虚线 所 指示 。 有 了 影子 副本 ， 转 发 决策 能 在 每 个 输入 冯 口 本 地 做 
出 ， 无 须 调用 中 央 路 由 选择 处 理 毅 ， 因 此 避免 了 集中 式 处 理 的 耗 颈 。 







数据 链 路 处 理 
(协议 ， 拆 封 ) 






图 4-7 输入 端口 处 理 


假定 转发 表 已 经 存在 ， 从 概念 上 讲 表 查找 是 简单 的 ， 即 我 们 只 是 搜索 转发 表 查 找 最 长 
前 缀 匹配 ， 如 4.2.2 所 描述 的 那样 。 但 在 吉 比 特 速 率 下 ， 这 种 查找 必须 在 纳 秒 级 执行 
(回想 我 们 前 面 10Cbps 链 路 和 一 个 64 F IP 数据 报 )。 因 此 ， 不仅 必 须要 用 便 件 执行 查 
找 ， 而 且 需 要 对 大 型 转发 表 使 用 超出 简单 线性 搜索 的 技术 ; 快速 查找 算法 的 综述 能 够 在 
[Gupta 2001, Ruiz-Sanchez 2011] 中 找到 。 同 时 必须 对 内 存 访问 时 间 给 予 特别 关注 ， 这 于 
致 用 通信 式 片上 DRAM 和 更 快 的 SRAM (用 作 一 种 DRAM 缓存 ) 内 存 来 设计 。 三 态 内 容 
可 寻 址 存储 器 (Tenary Content Address Memory, TCAM) 也 经 稼 被 用 于 查找 。 使 用 一 个 
TCAM， 一 个 32 比特 IP 地 址 被 放 和 内存 ，TCAM 在 基本 常数 时 间 内 返回 对 该 地 址 的 转发 表 
项 的 内 容 。Cisco 8500 Xf ES ay A im FAA + 64K 的 CAM, 

— Fadi ct 4 Fe ie FRE oP ZH hig, WU oP A EB ACT HE A ACERT. TERE 
些 设计 中 ， 如 果 来 自 其 他 输入 端口 的 分 组 当前 正在 使 用 该 交换 结构 ， 一 个 分 组 可 能 会 在 
进入 交换 结构 时 被 暂时 阻塞 。 因此， 一 个 被 阻塞 的 分 组 必须 要 在 输入 病 口 处 排队 ， 并 等 
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得 稍 后 被 及 时 调度 以 通过 交换 结构 。 我 们 将 在 4.3.4 节 中 仔细 观察 分 组 (位 于 输入 与 输 
出 端口 中 ) 的 阻塞 、 排 队 与 调度 . 尽管 “查找 ”在 输入 端口 处 理 中 可 以 说 是 最 为 重要 
的 动作 ， 但 必须 采取 许多 其 他 动作 : 必须 出 现 物理 层 和 链 路 层 处 理 ， 如 前 面 所 讨论 的 
那样 ，@) 必 须 检查 分 组 的 版 本 号 、 检 验 和 以 及 寿命 字段 ( 这些 我 们 将 在 4.4.1 节 中 学 
习 ) ， 并 且 重 写 后 两 个 字段 ; (3 必须 更 新 用 于 网 络 管理 的 计数 器 (如 接收 到 的 IP 数据 报 
的 数目 ) 。 

在 结束 输入 端口 处 理 的 讨论 之 前 ， 我 们 注意 到 输入 端口 查找 IP 地 址 然后 发 送 该 分 组 
进入 交换 结构 (“动作 ” ) 的 步 缀 是 一 种 更 为 一 般 的 “匹配 加 动作 ”抽象 的 特定 情况 ， 这 
种 抽象 执行 在 许多 网 络 设备 中 ， 而 不 仪 在 路 由 帮 中 。 在 链 路 层 交 换 机 (在 第 5 曹 讨论 ) 
中 ， 除 了 发 送 帧 进入 交换 结构 去 往 输出 端口 外 ， 还 要 查找 链 路 层 目的 地 址 ， 并 采取 几 个 动 
E. 在 防火 墙 (包含 在 第 8 m) 中 ， 首 部 匹配 给 定 准 则 (例如 源 / 目 的 TP 地址 和 运输 层 着 
口号 的 某 种 组 合 ) 的 入 分 组 可 能 被 阻止 转发 ， 而 防火 墙 是 一 种 过 滤 所 选择 的 人 分 组 的 设 
备 。 在 网 络 地 址 转换 (NAT， 包 含 在 4.4 节 中 ) 中， 一 个 运输 层 端 口号 匹配 某 给 定 值 的 人 
分 组 ， 在 转发 (动作 ) 前 其 端口 号 将 被 重 写 ， 因 此,“ 匹配 加 动作 ”抽象 不 仅 作 用 大 ， 而 
旦 在 网 络 设备 中 无 所 不 在 


4.3.2 交换 结构 


交换 结构 位 于 一 台 路 由 需 的 核心 部 位 。 正 是 通过 这 种 交换 结构 ， 分 组 才能 实际 地 从 一 
个 输入 端口 交换 ( 即 转 发 ) 到 一 个 输出 端口 中 。 交 换 可 以 用 许多 方式 完成 ， 如 图 4-8 
所 示 。 


内 存 


纵横 式 





图 例 : 
口中 jE 输入 端口 fw CC 输出 端口 


图 4-8 三 种 交换 技术 
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4# 


。 经 内 存 交 换 。 最 简单 、 最 早 的 路 由 器 是 传统 的 计算 机 ， 在 输入 端口 与 输出 端口 之 


间 的 交换 是 在 CPU (路 由 选择 处 理 器 ) 的 直接 控制 下 完成 的 。 输入 与 输出 端口 的 
功能 就 像 在 传统 操作 系统 中 的 LO 设备 一 样 。 一 个 分 组 到 达 一 个 输入 端口 时 ， 该 
闪 口 会 先 通过 中 断 方式 回路 由 选择 处 理 需 发 出 信号 。 于是， 该 分 组 从 输入 端口 处 
被 复制 到 处 理 需 内 存 中 。 路 由 选 撞 处 理 带 则 从 其 首部 中 提取 目的 地 址 ， 在 转发 表 
中 找 出 适当 的 输出 端口 ， 并 将 该 分 组 复制 到 输出 端口 的 缓存 中 .在 这 种 情况 下 ， 
如 果 内 存 融 宽 为 每 秒 可 写 进 内 存 或 从 内 存 读 出 下 个 分 组 ， 则 总 的 转发 吞吐 量 (分 
组 从 输入 并口 被 传送 到 输出 端口 的 总 速率 ) 必然 小 于 B/2。 也 要 注意 到 不 能 同时 
转发 两 个 分 组 ， 即 使 它们 有 不 同 的 端口 号 ， 因 为 经 过 共享 系统 总 线 一 次 仪 能 执行 


一 个 内 存 读 / 写 。 
许多 现代 路 由 器 通过 内 存 进 行 交 换 。 然 而 ， 与 早期 路 由 器 的 一 个 主要 差别 


是 ,目的 地 址 的 查找 和 将 分 组 存储 (交换) 进 适 当 的 内 存 存 储 位置 是 由 输入 线 
路 卡 来 处 理 的 。 在 菜 些 方面 ， 经 内 存 交 换 的 路 由 需 看 起 来 很 像 共享 内 存 的 多 处 
理 机 ， 用 一 个 线路 卡 上 的 处 理 将 分 组 交换 〈 写 ) 进 适 当 的 输出 端口 的 内 存 中 。 
Cisco 的 Catalyst 8500 系列 的 交换 机 | Cisco 8500 2012] 是 经 共享 内 存 转 发 分 
组 的 。 

经 总 线 交 换 。 在 这 种 方法 中 ， 输 入 端口 经 一 根 共 享 总 线 将 分 组 直接 传送 到 输出 
mH, ， 不 震 要 路 由 选择 处 理 器 的 十 预 。 通 党 按 以 下 方式 完成 该 任务 : 让 输入 端 
口 为 分 组 预先 计划 一 个 交换 机 内 部 标签 ( 首部)， 指 示 本 地 输出 端口 ， 使 分 组 在 
总 线 上 传送 和 传输 到 输出 端口 。 该 分 组 能 由 所 有 输出 端口 收 到 ， 但 只 有 与 该 标 
签 匹 配 的 问 口 才能 保存 该 分 组 。 然 后 标签 在 输出 端口 被 去 除 ， 因 为 其 仅 用 于 交 
换 机 内 部 来 路 越 总 线 。 如 果 多 个 分 组 同时 到 达 路 由 器 ， 每 个 位 于 不 同 的 输出 端 
口 ， 除 了 一 个 分 组 外 所 有 其 他 分 组 必须 等 待 ， 因 为 一 次 只 有 一 个 分 组 能 够 跨越 
总 线 。 因 为 每 个 分 组 必须 跨 过 单一 总 线 ， 故 路 由 器 的 交换 带宽 受 总 线 速率 的 限 
制 ; 在 我 们 环 状 交 叉 路 的 类 比 中 ,这 相当 于 环 状 交叉 路 一 次 仅 包含 一 辆 汽车 。 
尽管 如 此 ， 对 于 运行 在 小 型 局 域 网 和 企业 网 中 的 路 由 器 来 说 ， 通 过 总 线 交 换 通 
第 是 足够 的 。Cisco 5600 | Cisco Switches 2012] 交换 机 通过 一 个 32Gbps 背 板 总 
线 来 交换 分 组 。 

经 互联 网 络 交 换 。 殉 服 单一 、 共 享 式 总 线 市 宽 限 制 的 一 种 方法 是 ， 使 用 一 个 更 复 
杂 的 互联 网 络 ， 例 如 过 去 在 多 处 理 顺 计算 机 体系 结构 中 用 来 互联 多 个 处 理 器 的 网 
络 。 纵 横 式 交换 机 就 是 一 种 由 2N 条 总 线 组 成 的 互联 网 络 ， 它 连接 N 个 输入 端口 
IN 个 输出 闯 口 ， 如 岁 4-8 所 示 。 每 条 垂直 的 总 线 在 交叉 点 与 每 条 水 平 的 总 线 交 
义 ， 交 义 点 通过 交换 结构 控制 融 (其 逻辑 是 交换 结构 自 喘 的 一 部 分 ) 能 够 在 任何 
时 候 开 局 和 闭合 。 当 某 分 组 到 达 端 口 A， 需 要 转发 到 端口 Y， 交换 机 控制 器 闭合 
电线 A 和 YY 交叉 部 位 的 交叉 点 ， 然 后 端口 A 在 其 总 线 上 发 送 该 分 组 ， 该 分 组 仅 由 
总 线 Y 安排 接收 。 注 意 到 来 上 自 端 口 B 的 一 个 分 组 在 同一 时 间 能 够 转发 到 端口 X, 
因为 A F) Y 和 B 到 X 的 分 组 使 用 不 同 的 输入 和 输出 总 线 。 因 此 ， 与 前 面 两 种 交换 
方法 不 同 ， 纵 横 式 网 络 能 够 并 行 转 发 多 个 分 组 . 然而 ， 如 果 来 自 两 个 不 同 输入 端 
口 的 两 个 分 组 其 目的 地 为 相同 的 输出 端口 ， 则 一 个 分 组 必须 在 输入 端 等 待 ， 因 为 
在 某 个 时 刻 经 给 定 总 线 仅 有 一 个 分 组 能 够 发 送 。 
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更 为 复杂 的 互联 网 络 使 用 多 级 交换 元 素 ， 以 使 来 月 不 同 输 入 端口 的 分 组 通过 交 
换 结 构 同 时 朝 着 相同 的 输出 端口 前 行 。 对 交换 机 体系 结构 的 展望 可 参见 [ Tobagi 
1990 | Cisco 12000 系列 交换 机 [ Cisco 12000 2012] 使 用 了 一 个 互联 网 络 。 


4.3.3 输出 端口 
如 图 4-9 中 所 示 ， 输 出 端口 处 理 取 出 存放 在 输出 端口 内 存 中 的 分 组 并 将 其 发 送 到 输出 
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图 4-9 fih im O Ack 


4.3.4 何 处 出 现 排队 


如 果 我 们 考虑 显示 在 图 4-8 中 的 输入 和 输出 桨 口 功 能 及 其 配置 ， 就 会 明显 发 现在 输入 
端口 和 输出 病 口 处 部 能 够 形成 分 组 队列 ， 就 像 在 环 状 交 义 路 的 类 比 中 我 们 已 知 的 情况 , 汽 
车 可 能 等 竺 在 流量 交叉 点 的 人 口 和 出 口 。 排 队 的 位 置 和 程度 (或 者 在 输入 端口 排队 ， 或 者 
在 输出 交口 排队 ) 将 取决 于 流量 负载 、 交 换 结 构 的 相对 速率 和 线路 速率 。 我 们 现在 更 为 详 
细 一 点 考虑 这 些 队列 ， 因 为 随 着 这 些 队 列 的 增长 ， 路 由 帮 的 缓存 空间 将 最 终 会 耗 尽 ， 并 且 
当 无 内 存 可 用 于 存储 到 达 的 分 组 时 将 会 出 现 丢 包 (packet loss ) .回想 前 面 的 讨论 ， 我 们 说 
过 分 组 “在 网 络 中 丢失 ”或 “被 路 由 硕 丢弃" 。 正 是 在 一 台 路 由 天 的 这 些 队 列 中 ， 这 些 分 
组 被 实际 丢弃 或 丢失 ， 


和 六 个 输出 端口 。 为 进一步 简化 讨论 ， 假 设 所 有 分 组 具有 相同 的 固定 长 度 ， 分 组 以 同步 的 
方式 到 达 输 入 端口 。 这 就 是 说 ， 在 任何 链 路 发 送 分 组 的 时 间 等 于 在 任何 链 路 接收 分 组 的 时 
则 ， 在 这 样 的 时 间 间 阳 内 ， 在 一 个 输入 链 路 上 能 够 到 达 0 个 或 1 个 分 组 . 定义 交换 结构 传 


在 输入 闯 口 处 仅 会 出 现 微不足道 的 排队 。 这 是 因为 即使 在 最 坏 情况 下 ， 所 有 N 条 输入 线路 
都 在 接收 分 组 ， 并 且 所 有 的 分 组 将 被 转发 到 相同 的 输出 端口 ， 每 批 A 个 分 组 (每 个 输入 端 
口 一 个 分 组 ) 能 够 在 下 一 批 到 达 前 通过 交换 结构 处 理 完 毕 。 

但 是 在 输出 端口 处 会 发 生 什 么 情况 呢 ? 我 们 仍然 假设 Rowin E Rin TRON fF. TARE, F 
达 N 个 输入 端口 的 每 个 端口 的 分 组 都 发 向 相同 的 输出 端口 。 在 这 种 情况 下 ， 在 加 输出 链 路 
发 送 一 个 分 组 的 时 间 内 ， 将 有 N 个 分 组 到 达 该 输出 端口 。 因 为 输出 端口 在 一 个 单位 时 间 
( 分 组 传输 时 间 ) 内 只 能 发 送 一 个 分 组 ， 这 VN 个 到 达 的 分 组 必须 排队 (等待) 传输 到 输出 
链 路 上 。 于 是 ， 又 有 N 个 分 组 可 能 在 它 只 能 发 送 已 排队 的 w 个 分 组 中 的 一 个 的 时 间 内 到 
iA, 这 种 情况 会 不 断 持 续 下 去 。 最 终 ， 排 队 的 分 组 数量 会 增长 得 很 快 ， 足 以 耗 尽 输出 端口 
的 可 用 内 存 ， 在 这 样 的 情况 下 分 组 被 丢弃 。 

在 图 4-10 中 图 示 了 输出 端口 的 排队 情况 。 在 时 刻 :， 每 个 入 端 输入 端口 都 到 达 了 一 个 
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分 组 ， 每 个 分 组 都 是 发 往 最 上 侧 的 输出 端口 。 假 定 线路 速度 相同 ， 交 换 以 三 倍 快 的 线路 速 
度 进 行 操作 ， 一 个 时 间 单 位 以 后 〈 即 接收 或 发 送 一 个 分 组 所 需 的 时 间 ) ， 所 有 三 个 初始 分 
组 都 被 传送 到 输出 问 口 ， 并 排队 等 竺 传输 。 在 下 一 个 时 间 单 位 中 ， 这 三 个 分 组 中 的 一 个 将 
通过 输出 链 路 发 送出 去 。 在 这 个 例子 中 ， 又 有 两 个 新 分 组 已 到 达 交 换 机 的 入 端 ; 这 些 分 组 
之 一 要 发 往 最 上 侧 的 输出 端口 。 

在 时 刻 / 的 输出 端口 竞争 


I. 







w 让 一 


图 4-10 输出 端口 排队 


假定 需要 路 由 右 缓 存 来 吸收 流量 负载 的 波动 ， 一 个 自然 而 然 的 问题 就 是 需要 多 少 绥 
存 。 多 年 以 来 ， 对 缓存 长 度 的 经 验方 法 是 [RFC 3439 ] ， 缓 存 数量 (B) 应 当 等 于 平均 往 
返 时 延 (RTT， 比 如 说 250ms) 乘 以 链 路 的 容量 (C)。 这 个 结果 是 基于 相对 少量 的 TCP 流 
的 排队 动态 性 分 析 得 到 的 [Villamizar 1994 ] 。 因 此 ， 一 条 具有 250ms RTT 的 10Gbps 链 路 
将 需要 的 缓存 量 等 于 B = RTT.' C =2.5Gb。 然 而 ,最 近 的 理论 和 试验 研究 | Appenzeller 
2004] 表明 ， 当 有 大 量 的 TCP 流 (N) 流 过 一 条 链 路 时 ， 缓存 所 需要 的 数量 是 B= RTT- 
C/VN。 对 于 通常 有 大 量 流 经 过 的 大 型 主干 路 由 器 链 路 (参见 如 [ Fraleigh 2003 ] ), N 的 
值 可 能 非常 大 ， 这 使 得 所 需 的 缓存 长 度 的 减 小 相当 明显 。 [Appenzeller 2004; Wischik 
2005; Beheshti 2008] 从 理论 、 实 现 和 运行 的 角度 提供 了 可 读 性 很 强 的 有 关 绥 存 长 度 问 题 
的 讨论 。 

输出 端口 排队 的 后 果 就 是 ， 在 输出 端口 上 的 一 个 分 组 调度 程序 (packet scheduler) 必 
须 在 这 些 排队 的 分 组 中 选 出 一 个 来 发 送 。 这 种 选择 可 能 是 根据 简单 的 原则 来 定 ， 如 先 来 先 
服务 (FCFS) 调度 ,或 者 更 复杂 的 调度 规则 ， 如 加 权 公 平 排队 (WFQ)。WFQ 规则 是 在 
具有 排队 等 待 传输 的 分 组 的 不 同 端 到 端 连接 之 间 公 平地 共享 输出 链 路 。 分 组 调度 程序 在 所 
供 服 务 质量 保证 ( quality-of-service guarantee) 方面 起 着 关键 作用 。 我 们 将 在 第 7 草 更 深入 
地 讨论 分 组 调度 。 有 关 输 出 端口 分 组 调度 规则 的 讨论 见 [Cisco Queue 2012 | 。 

类 似 地 ， 如 果 没 有 足够 的 内 存 来 缓存 一 个 人 分 组 ， 那 么 必须 做 出 决定 : 要 么 丢弃 到 达 
的 分 组 (一 种 称 为 弃 尾 (drop-tail) 的 策略 ) ， 要 么 删除 一 个 或 多 个 已 排队 的 分 组 来 为 新 
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到 的 分 组 腾 出 空间 。 在 某 些 情况 下 ， 在 缓存 填 满 前 便 丢 弃 (或 在 首部 加 标记 ) 一 个 分 组 ， 
以 便 回 发 送 方 提供 一 个 拥塞 信号 的 做 法 是 有 利 的 。 已 经 提出 和 分 析 了 许多 分 组 丢弃 与 标记 
fit | Labrador 1999, Hollot 2002], 这些 策 略 统称 为 主动 队列 管理 (Active Queue Manage- 
ment, AQM) 算法 。 随 机 早期 检测 (Random Early Detection, RED) 算法 是 一 种 得 到 最 广 
泛 研 究 和 实现 的 AQM 算法 。 在 RED 算法 中 ， 为 输出 队列 长 度 维护 着 一 个 加 权 平 均值 。 如 
东平 均 队 列 长 度 小 于 最 小 浆 值 min,,; ， 则 当 一 个 分 组 到 达 时 ， 该 分 组 被 接纳 进 队 列 。 相 反 ， 
如 1 果 队 列 满 或 平均 队列 长 度 大 于 最 大 阅 值 max,, ， 则 当 一 个 分 组 到 达 时 ， 该 分 组 被 标记 或 
JF. 最后， 如 果 一 个 分 组 到 达 ， 发 现 平 均 队 列 长 度 在 [ min, max, | 之 间 时 ， 则 该 分 
组 以 菜 种 概率 被 标记 或 丢弃 ， 该 概率 一 般 是 平均 队列 长 度 、mins 和 maxa AERA E 
是 出 了 一 些 概率 标记 /丢弃 图 数 ， 各 种 版 本 的 RED 已 被 分 析 建 模 、 模 拟 和 /或 实现 。 
| Christiansen 2001 | 与 | Floyd 2012] 为 谍 外 阅读 提供 了 综述 及 指南 。 

如 果 交 换 结 构 不 能 快 得 〈 相 对 于 输入 线路 速度 而 言 ) 使 所 有 到 达 分 组 无 时 延 地 通过 人 它 
传送 ， 则 在 输入 端口 也 将 出 现 分 组 排队 ， 因 为 到 达 的 分 组 必须 加 和 输入 端口 队列 中 ， 以 等 
竺 通过 交换 结构 传送 到 输出 端口 。 为 了 举例 说 明 这 种 排队 的 重要 后 果 ， 考 虑 纵横 式 交 换 结 
构 ， 并 假定 : 山 所 有 链 路 速度 相同 ; 忆 ) 一 个 分 组 能 够 以 一 条 输入 链 路 接收 一 个 分 组 所 用 的 
相同 的 时 间 量 ， 从 任意 一 个 输入 端口 传送 到 给 定 的 输出 端口 ; (3 分 组 按 FCFS 方式 ， 从 一 
指定 输入 队列 移动 到 其 要 求 的 输出 队列 中 只 要 其 输出 端口 不 同 ， 多 个 分 组 可 以 被 并 行 传 
送 。 然 而 ， 如 果 位 于 两 个 输入 队列 前 端的 两 个 分 组 是 发 往 同一 输出 队列 的 ， 则 其 中 的 一 个 
分 组 将 被 阻塞 ， 且 必须 在 输入 队列 中 等 待 ， 因 为 交换 结构 一 次 只 能 传送 一 个 分 组 到 某 指 定 


hig H 。 





浅 色 阴影 分 组 经 受 了 HOL 阻 塞 





图 例 : 
A 发 向 上 面 的 输出 端口 乔 发 向 中 间 的 输出 端口 等 发 向 下 面 的 输出 端口 


图 4-11 在 一 个 输入 排队 交换 机 中 的 HOL 阻塞 


图 4-11 显示 了 一 个 例子 ， 其 中 在 输入 队列 前 端的 两 个 分 组 (和 市 深 色 阴影 ) 要 发 往 同 
一 个 右上 和 角 输 出 端口 。 假 定 该 交换 结构 决定 发 送 左 上 和 角 队 列 前 端的 分 组 。 在 这 种 情况 下 ， 
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后 面 的 浅 色 阴影 分 组 也 要 等 待 ， 即 使 右 中 侧 和 输出 端口 〈 浅 色 阴 影 分 组 的 目的 地 ) AL 
争 。 这 种 现象 叫做 输入 排队 交换 机 中 的 线路 前 部 (Head- Of-the- Line，HOL) 阻塞 ， 即 在 
一 个 输入 队列 中 排队 的 分 组 必须 等 街 通过 交换 结构 发 送 〈 即 使 输出 端口 是 空闲 的 ) ， 因 为 
它 被 位 于 线路 前 部 的 万 一 个 分 组 所 阻 赛 。 | Karol 1987] 指出 ， 由 于 HOL 阻塞 ， 只 要 输入 
链 路 上 的 分 组 到 达 速 率 达 到 其 容量 的 58% ， 在 某 些 假设 前 提 下 ， 输 入 队列 长 度 将 无 限制 地 
增 大 〈 不 严格 地 讲 ， 这 等 同 于 说 将 出 现 大 量 的 丢 包 ) 。|[ McKeown 1997b] 讨论 了 许多 种 解 
决 HOL 阻塞 的 方法 。 


4. 3.5 路 由 选择 控制 平面 


在 我 们 至 此 所 进行 的 讨论 和 图 4-6 中 ， 我 们 已 经 隐 含 地 假设 路 由 选择 控制 平面 全 部 驻 
留 并 运行 在 路 由 需 中 的 路 由 选择 处 理 器 上 。 网 络 范围 的 路 由 选择 控制 平面 因此 是 分 布 式 
的 ， 即 不 同 部 分 (例如 路 由 选择 算法 ) 执行 在 不 同 的 路 由 硕 上 并 且 通 过 彼此 发 送 控 制 报 文 
进行 区 互 。 实 际 上 ， 今 天 因特网 路 由 需 和 我 们 将 在 4. 6 节 中 学 习 的 路 由 选择 算法 正 是 以 这 
种 方式 运行 的 。 此 外 ， 路 由 希 和 交换 机 广 商 将 它们 的 硬件 数据 平面 和 软件 控制 平面 绑 在 一 
起 放 入 封闭 (但 可 互 操 作 ) 的 平台 中 ， 成 为 一 种 垂直 综合 的 产品 。 

近来 ,一 些 人 研究 人 员 | Caesar 2005a; Casado 2009; McKeon 2008] 已 经 着 手 探 索 新 型 
路 由 痊 控 制 平 面体 系 结构 ， 其 中 数据 平面 连同 部 分 控制 平面 (例如 ， 链 路 状态 的 本 地 测量 
/报告 ， 转 发 表 的 安装 和 维护 ) 在 路 由 硕 中 实现 ， 部 分 控制 平面 能 够 在 路 由 器 外 部 实现 
(例如 ， 在 能 够 执行 路 由 计算 的 集中 式 服 务 帮 中 实现 ) 。 一 个 定义 良好 的 API 规定 了 这 两 个 
部 分 彼此 交互 和 通信 的 方式 。 这 些 研 究 人 员 争 辩 说 将 软件 控制 平面 与 硬件 数据 平面 (具有 
最 少 的 路 由 器 驻 留 控制 平面 ) 分 离 ， 能 够 以 集中 式 路 由 选择 计算 代替 分 布 式 路 由 选择 计 
算 ， 从 而 简化 路 由 选择 ， 通 过 允许 不 同 的 用 户 定制 的 控制 平面 在 快速 的 硬件 数据 平面 上 运 
行 ， 能 够 进行 网 络 创 新 。 


4.4 网 际 协议 : 因特网 中 的 转发 和 编 址 


到 目前 为 止 ， 我 们 有 关 网 络 层 编 址 和 转发 的 讨论 并 未 提 及 任何 特定 的 计算 机 网 络 。 在 
这 广 中 ， 我 们 将 注意 力 转 向 在 因特网 中 是 如 何 完成 编 址 和 转发 的 。 我 们 将 看 到 因特网 编 址 
和 转发 是 网 际 协议 (IP) 的 重要 组 件 。 目 前 有 两 个 版 本 的 了 P 在 使 用 。 我 们 首先 研究 广泛 
Ta AY IP 协议 版 本 4， 这 通 笛 简 称 为 IPv4 [RFC 791 ]。 我 们 将 在 本 节 结 尾 研 究 IP 版 本 6 
[ RFC 2460; RFC 4291 |] ,已 经 提议 用 它 蔡 代 IPv4。 

在 我 们 尝试 研究 IP 之 前 ， 先 来 考虑 构成 因特网 的 网 络 层 的 一 些 组 件 。 如 图 4-12 中 所 
示 ， 因 特 网 的 网 络 层 有 三 个 主要 组 件 。 第 一 个 组 件 是 卫 协议 , 它 是 本 节 的 主题 。 第 二 个 
主要 组 件 是 路 由 选择 部 分 ， 它 决定 了 数据 报 从 源 到 目的 地 所 流 经 的 路 径 。 我 们 前 面 讲 过 路 
由 选择 协议 计算 出 用 于 在 网 络 中 转发 分 组 的 转发 表 。 我 们 将 在 4.6 节 中 研究 因特网 的 路 由 
选择 协议 。 网 络 层 的 最 后 一 个 组 件 是 报告 数据 报 中 的 差错 和 对 某 些 网 络 层 信 息 请 求 进行 响 
应 的 设施 。 我 们 将 在 4.4.3 节 中 涉及 因特网 的 网 络 层 差错 和 信息 报告 的 协议 ， 即 互联 网 控 
制 报 文 协议 (ICMP). 
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图 4-12 ” 轩 特 网 网 络 层 的 内 部 视图 


4.4.1 数据 报 格式 


前 面 讲 过 网 络 层 分 组 被 称 为 数据 报 。 我 们 以 概述 IPv4 数据 报 的 语法 和 语义 开始 对 IP 
的 学 习 。 你 也 许 认为 没有 什么 比 一 个 分 组 的 比特 的 语法 和 语义 更 加 枯燥 无 味 的 了 。 无 论 如 
何 ， 数 据 报 在 因特网 中 起 着 重要 作用 ， 每 个 网 络 行业 的 学 生 和 专业 人 员 都 需要 理解 它 、 吸 
收 它 并 掌握 它 。IPv4 数据 报 格式 如 图 4-13 所 示 。 


32 比 特 





图 4-13 IPv4 数据 报 格式 


IPv4 数据 报 中 的 关键 字段 如 下 : 

e 版 本 (号 )。 这 4 比特 规定 了 数据 报 的 IP 协议 版 本 。 通 过 碍 看 版 本 号 ， 路 由 天 能 
够 确定 如 何 解释 IP 数据 报 的 剩余 部 分 。 不 同 的 下 版 本 使 用 不 同 的 数据 报 格 式 。 目 
前 版 本 的 IP( 即 IPv4) 的 数据 报 格式 如 图 4-13 所 示 。 新 版 本 的 IP (IPv6) 的 数据 
IRER SORE TEAR Ta TT 
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首部 长 度 。 因 为 一 个 IPv4 数据 报 可 包含 一 些 可 变数 量 的 选项 (这些 选项 包括 在 
IPv4 数据 报 首部 中 ) ， 故 需要 用 这 4 比特 来 确定 IP 数据 报 中 数据 部 分 实际 从 哪里 
开始 。 大 多 数 IP 数据 报 不 包含 选项 ， 所 以 一 般 的 IP 数据 报 具 有 20 字 节 的 首部 。 
服务 类 型 。 服 务 类 型 (TOS) 比特 包含 在 IPv4 首部 中 ， 以 便 使 不 同类 型 的 IP 数据 
报 〈 例 如 ， 一 些 特 别 要 求 低 时 延 、 高 吞吐 量 或 可 靠 性 的 数据 报 ) 能 相互 区 别 开 来 。 
例如 ， 将 实时 数据 报 ( 如 用 于 IP 电话 应 用 ) 与 非 实时 流量 (如 FTP) 区 分 开 也 许 
是 有 用 的 。 提 供 特 定 等 级 的 服务 是 一 个 由 路 由 天 管理 员 决 定 的 策略 问题 。 我 们 将 
在 第 7 章 详细 讨论 区 分 服务 主题 。 

数据 报 长 度 。 这 是 卫 数 据 报 的 总 长 度 〈 首 部 加 上 数据 ) ， 以 字 节 计 。 因 为 该 字段 
长 为 16 比特 ， 所 以 IP 数据 报 的 理论 最 大 长 度 为 65 535 F., PAT, BARR 
有 超过 1500 “17 AY). 

标识 、 标 志 、 片 偏 移 。 这 三 个 字段 与 所 谓 PP 分 片 有 关 ， 这 是 一 个 我 们 将 很 快要 深 
人 考虑 的 一 个 问题 。 有 趣 的 是 ， 新 版 本 的 IP ( 即 IPv6) 不 允许 在 路 由 硕 上 对 分 组 
分 片 。 

寿命 ， 寿 命 (Time-To-Live, TTL) 字段 用 来 确保 数据 报 不 会 永远 ( 如 由 于 长 时 间 
的 路 由 选择 环 路 ) 在 网 络 中 循环 。 每 当 数 据 报 由 一 台 路 由 需 处 理 时 ， 该 字段 的 但 
威 1。 若 TTL 字 段 减 为 0， 则 该 数据 报 必须 丢弃 。 

协议 。 该 字段 仅 在 一 个 IP 数据 报到 达 其 最 终 目 的 地 才 会 有 用 。 该 字段 值 指 示 了 IP 
数据 报 的 数据 部 分 应 交 给 哪个 特定 的 运输 层 协 议 。 例 如 ， 值 为 6 表明 数据 部 分 要 
交 给 TCP， 而 值 为 17 表明 数据 要 交 给 UDP。 对 于 所 有 可 能 值 的 列表 ， 参 见 
[IANA Ptotocol Numbers 2012 ] 。 注 意 在 IP 数据 报 中 的 协议 号 所 起 的 作用 ， 类 似 于 
运输 层 报 文 段 中 端口 号 字段 所 起 的 作用 。 协 议 号 是 将 网 络 层 与 运输 层 绑 定 到 一 起 
的 粘 合 剂 ， 而 端口 号 是 将 运输 层 和 应 用 层 绑 定 到 一 起 的 粘 合剂 。 我 们 将 在 第 5 章 
看 到 ， 链 路 层 帧 也 有 一 个 特殊 字段 用 于 将 链 路 层 与 网 络 层 绑 定 到 一 起 .。 

首部 检验 和 。 首 部 检验 和 用 于 帮助 路 由 需 检 测 收 到 的 下 数据 报 中 的 比特 错误 。 首 
部 检验 和 是 这 样 计 算 的 : 将 首部 中 的 每 2 个 字 节 当 作 一 个 数 ， 用 反 码 运算 对 这 些 
数 求 和 。 如 在 3. 3 节 讨 论 的 那样 ， 该 和 的 反 码 (被 称 为 因特网 检验 和 ) 存放 在 检 
验 和 字段 中 。 路 由 器 要 对 每 个 收 到 的 IP 数据 报 计算 其 首部 检验 和 ， 如 果 数 据 报 诈 
部 中 携带 的 检验 和 与 计算 得 到 的 检验 和 不 一 致 ， 则 检测 出 是 个 差错 。 路 由 需 一 般 
会 丢弃 检测 出 错误 的 数据 报 。 注 意 到 在 每 台 路 由 器 上 必须 重新 计算 检验 和 并 册 次 
存放 到 原 处 ， 因 为 TTL 字 段 以 及 可 能 的 选项 字段 会 改变 。 关 于 计算 因特网 检验 和 
的 快速 算法 的 有 趣 讨 论 参 见 | RFC 1071]。 此 时 ， 一 个 经 常 问 到 的 问题 是 : 为 什 
Z TCP/IP 在 运输 层 与 网 络 层 都 执行 差错 检测 ?这 种 重复 检测 有 几 种 原因 。 痛 先 ， 
注意 到 在 IP 层 只 对 IP 首部 计算 了 检验 和 ， 而 TCP/UDP 检验 和 是 对 整个 TCP/UDP 
报 文 段 进行 的 。 其 次 ，TCP/UDP 与 IP 不 一 定 都 必须 属于 同一 个 协议 栈 。 原 则 上 
TCP 能 运行 在 一 个 不 同 的 协议 (如 ATM) E, m IP 能够 携带 不 一 定 要 传递 给 
TCP/UDP 的 数据 。 

源 和 目的 IP 地址。 当 某 源 生成 一 个 数据 报时 ， 它 在 源 IP 字段 中 插入 它 的 IP 地 址 ， 
在 目的 IP 地 址 字段 中 插入 其 最 终 目 的 地 的 地 址 。 通 常 源 主机 通过 DNS 查找 来 决定 
目的 地 址 ， 如 在 第 2 章 中 讨论 的 那样 。 我 们 将 在 4. 4. 2 节 中 详细 讨论 了 IP atk. 





© AR, HEINER IP 首部 被 扩展 。 首 部 选项 意味 着 很 少 使 用 ， 因 此 决定 对 每 个 
数据 报 首部 不 包括 选项 字段 中 的 信息 ， 这 样 能 够 节约 开销 。 然 而 ， 选 项 的 可 能 存 
在 的 确 是 件 复杂 的 事 ， 因 为 数据 报头 长 度 可 变 ， 故 不 能 预先 确定 数据 字段 从 何 处 
开始 。 而 且 还 因为 有 些 数据 报 要求 处 理 选 项 ， 而 有 些 数据 报 则 不 要 求 ， 故 导致 一 
台 路 由 顺 处 理 一 个 IP 数据 报 所 需 的 时 间 变 化 很 大 。 这 些 考 虑 对 于 融 性 能 路 由 各 和 
主机 上 的 IP 处 理 来 说 特别 重要 。 由 于 这 样 或 那样 的 原因 ， 在 IPv6 SPECA T 
IP 选项 ， 如 4. 4.4 节 中 讨论 的 那样 。 

© 数据 (有 效 载荷 ) 。 我 们 来 看 看 最 后 的 也 是 最 重要 的 字段 ， 这 是 数据 报 存 在 的 首要 
理由 ! 在 大 多 数 情 况 下 ，IP 数据 报 中 的 数据 字段 包含 要 交付 给 目的 地 的 运输 层 报 
文 段 (TCP 或 UDP). 然而 ， 该 数据 字段 也 可 承载 其 他 类 型 的 数据 ， 如 ICMP 报 文 
(在 4.4.3 节 中 讨论 )。 

注意 到 一 个 IP 数据 报 有 总 长 为 20 字 市 的 首部 (假设 无 选项 )。 如 末 数 据 报 承 载 一 个 
TCP 报 文 段 ， 则 每 个 (无 分 片 的 ) 数据 报 共 承载 了 总 长 40 字 市 的 站 部 (20 SA Ay IP H 
部 加 上 20 字 节 的 TCP 首部 ) 以 及 应 用 层 报 文 。 

IP 数据 报 分 片 

在 第 5 章 中 我 们 将 看 到 ， 并 不 是 所 有 链 路 层 协议 都 能 承载 相同 长 度 的 网 络 层 分 组 。 有 
的 协议 能 承载 大 数据 报 ， 而 有 的 协议 只 能 承载 小 分 组 。 例如， 以 太 网 帧 能 够 承载 不 超过 
1500 字 节 的 数据 ， 而 革 些 广域网 链 路 的 帧 可 承载 不 超过 576 字 节 的 数据 。 一 个 链 路 层 帧 能 
本 载 的 最 大 数据 量 叫 做 最 大 传送 单元 (Maximum Transmission Unit, MTU), ALAA IP & 
据 报 封装 在 链 路 层 帧 中 从 一 人 台 路 由 需 传 输 到 下 一 台 路 由 硕 ， 故 链 路 层 协 议 的 MTU 严格 地 
限制 着 IP 数据 报 的 长 度 。 对 IP 数据 报 长 度 具 有 严格 限制 并 不 是 主要 问题 。 问 题 在 于 在 发 
送 方 与 目的 地 路 径 上 的 每 段 链 路 可 能 使 用 不 同 的 链 路 层 协议 ， 且 每 种 协议 可 能 具有 不 同 
Ay MTU. 
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行 具 有 不 同 MTU 的 链 路 层 协 议 。 假 定 你 从 某 条 链 路 收 到 一 个 IP 数据 报 ， 通 过 检查 转发 表 
确定 出 链 路 ， 并 且 该 出 链 路 的 MTU EEIZ IP 数据 报 的 长 度 要 小 。 此 时 你 会 感到 慨 乱 ， 如 何 
将 这 个 过 大 的 IP 分 组 压缩 进 链 路 层 帧 的 有 效 载荷 字段 呢 ? 解决 该 问题 的 方法 是 将 IP 数据 
报 中 的 数据 分 片 成 两 个 或 更 多 个 较 小 的 IP 数据 报 ， 用 单独 的 链 路 层 帆 封 波 这 些 较 小 的 TP 
数据 报 ; 然后 回 输 出 链 路 上 发 送 这 些 帧 。 每 个 这 些 较 小 的 数据 报 都 称 为 片 〈fragment ) 。 

片 在 其 到 达 目 的 地 运输 层 以 前 需要 重新 组 装 。 实 际 上 ，TCP 与 UDP 都 希望 从 网 络 层 
收 到 完整 的 未 分 片 的 报 文 。IPv4 的 设计 者 感到 在 路 由 带 中 重新 组 六 数据 报 会 给 协议 市 来 相 
当 大 的 复杂 性 并 且 影 响 路 由 需 性 能 。( 如果 你 是 一 台 路 由 硕 ， 你 愿意 将 重新 组 疫 报 文 户 放 
在 你 必须 要 做 的 各 种 各 样 工 作 的 首位 吗 ?) 为 坚持 网 络 内 核 保持 简单 的 原则 ，IPv4 的 设计 
者 决定 将 数据 报 的 重新 组 装 工 作 放 到 闪 系 统 中 ， 而 不 是 放 到 网 络 路 由 融 中 。 

当 一 台 目 的 主机 从 相同 源 收 到 一 系列 数据 报时 ， 它 需要 确定 这 些 数据 报 中 的 采 些 是 否 
是 一 些 原 来 较 大 的 数据 报 的 片 。 如 果 某 些 数据 报 是 片 的 话 ， 则 它 必 须 进一步 确定 何 时 收 到 
了 最 后 一 片 ， 并 且 如 何 将 这 些 接 收 到 的 片 拼接 到 一 起 以 形成 初始 的 数据 报 。 为 了 让 目的 主 
机 执行 这 些 重新 组 装 任务 ，IPv4 的 设计 者 将 标识 、 标 志和 片 偏 移 字段 放 在 IP 数据 报 首部 
中 。 当 生成 一 个 数据 报时 ， 发 送 主机 在 为 该 数据 报 设 置 源 和 目的 地 址 的 同时 再 贴 上 标识 
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分 片 时 ， 形 成 的 每 个 数据 报 〈( 即 片 ) 具有 初始 数据 报 的 源 地 址 、 目 的 地 址 与 标识 号 ， 当 目 
的 地 从 同一 发 送 主机 收 到 一 系列 数据 报时 ， 它 能 够 检查 数据 报 的 标识 号 以 确定 哪些 数据 报 
实际 上 是 同一 较 大 数据 报 的 片 。 由 于 IP 是 一 种 不 可 靠 的 服务 ， 一 个 或 多 个 片 可 能 永远 到 
达 不 了 目的 地 。 因 为 这 种 原因 ， 为 了 让 目的 主机 绝对 地 相信 它 已 收 到 了 初始 数据 报 的 最 后 
一 个 片 ， 最 后 一 个 片 的 标志 比特 被 设 为 0， 而 所 有 其 他 片 的 标志 比特 被 设 为 1。 另 外， 为 
了 让 目的 主机 确定 是 否 丢失 了 一 个 片 〈 且 能 按 正 确 的 顺序 重新 组 装 片 ) ， 使 用 偶 移 字段 指 
定 该 片 应 放 在 初始 IP 数据 报 的 哪个 位 置 。 

图 4-14 图 示 了 一 个 例子 。 一 个 4000 字 节 的 数据 报 (20 F IP 首部 加 上 3980 Fi IP 
有 效 载 何 ) 到 达 一 台 路 由 需 ， 且 必须 被 转发 到 一 条 MTU 为 1500 字 贡 的 链 路 上 。 这 就 意味 
者 初始 数据 报 中 3980 字 节 数据 必须 被 分 配 为 3 个 独立 的 片 (其 中 的 每 个 片 也 是 一 个 下 数 
HEH). 假定 初始 数据 报 贴 上 的 标识 号 为 777。 三 个 片 的 特点 如 表 4-2 所 示 。 表 4-2 中 的 值 
反映 了 除了 最 后 一 片 的 所 有 初始 有 效 载 何 数 据 的 数量 应 当 是 8 字 市 的 倍数 ， 并 且 仿 移 值 应 
当 被 规定 以 8 字 节 块 为 单位 。 







FA: 
入 : 一 个 大 数据 报 〈4000 字 节 ) 
出 : 3 个 较 小 数据 报 


链 路 MTU : 1500 字 节 






Se 





入 : 3 个 较 小 数据 报 
th: 一 个 大 数据 报 (4000 FH) 





图 4-14 JP 分 片 与 重新 组 装 


表 4-2 IPH 
片 字 节 ID 偏 移 标志 
第 1 片 IP 数据 报 的 数据 字段 ”identification = 777 offset =0 (表示 插入 的 数据 开始 于 flag =1 (表示 后 
中 的 1480 字 节 字 节 0) 面 还 有 ) 
第 2 片 1480 字 节 数据 identification = 777 offset = 185 (表示 插入 的 数据 开始 flag =1 (表示 后 


于 字 节 1480。 注 意 185 x8 = 1480) 面 还 有 ) 


第 3 片 1020 字 节 数据 ( =3980 identification = 777 offset =370 (表示 插入 的 数据 开始 flag =0 (表示 这 
~ 1480 - 1480) 于 字 节 2960。 注 意 370 x8 =2960) ”是 最 后 一 个 片 ) 


在 目的 地 ， 数 据 报 的 有 效 载 癸 仅 当 在 瑟 层 已 完全 重 构 为 初始 IP 数据 报时 ， 才 被 传递 
给 目的 地 运输 层 。 如 有 果 一 个 或 多 个 片 没有 到 达 目 的 地 ， 则 该 不 完整 的 数据 报 被 丢弃 且 不 会 
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交 给 运输 层 。 但 是 ， 如 我 们 在 前 一 章 知 道 的 那样 ， 千 在 运输 层 正 使 用 着 TCP， 则 TCP 将 通 
过 让 源 以 初始 数据 报 来 重 传 数 据 ， 以 恢复 这 次 丢 包 . 

我 们 刚刚 学 习 了 IP 分 片 在 将 许多 完全 不 同 的 链 路 层 技术 粘 合 起 来 的 过 程 中 起 到 了 重 
要 作用 ,但 是 分 片 也 是 有 开销 的 。 首 先 ， 它 使 路 由 费 和 端 系统 更 为 复杂 。 其 次 ,分 片 能 够 
征用 于 生成 致命 的 DoS 攻击 ， 由 此 攻击 者 发 送 了 一 系列 上 古怪 的 、 Ate BEY Fr. Jolt2 攻击 
就 是 一 个 经 典 的 例子 ， 其 中 某 攻 击 者 癌 目标 主机 发 送 了 小 片 的 流 ， 这 些 片 中 没有 一 个 片 的 
偏 移 量 是 0。 当 目 标 试图 从 这 些 不 良 分 组 中 重建 数据 报时 ， 可 能 会 月 演 。 男 一 类 行为 是 发 
送 交 迭 的 IP 片 ， 即 这 些 片 的 偏 移 量 值 被 设置 得 不 能 够 适当 地 排列 起 来 。 易 受 攻 击 的 操作 
ASCH PATH ACE A A AS ALIA May MT, AT HE SSA Toe [ Skoudis 2006 | 。 如 我 们 将 在 本 市 
结束 看 到 的 那样 ，IP 协议 的 新 版 本 IPv6 从 根本 上 废止 了 分 片 ， 从 而 简化 了 IP 分 组 的 处 
FE, HAE IP 不 太 容 易 受 到 攻击 . 

在 本 书 的 Web 站 点 ， 我们 提供 了 一 个 Java 小 程序 来 产生 片 。 你 提供 入 数据 报 长 度 、 
MTU 和 入 数据 报 标识 它 就 自动 为 你 产生 片 。 参 见 http: //www. awl. com/kurose- ross, 


4.4.2 |IPv4 编 址 


我 们 现在 将 注意 力 转 回 IPv4 编 址 。 尽 管 你 可 能 认为 编 址 是 相当 直接 的 主题 ， 但 我 们 
希望 通过 本 和 草 的 和 学习， 你 能 认识 到 因特网 编 址 不 仅 是 一 个 丰富 多 彩 、 微 妙 和 有 趣 的 主题 ， 
而 且 也 是 一 个 对 因特网 极为 重要 的 主题 。[ 3Com Addressing 2012) 和 [Stewart 1999 | 的 第 
1 章 都 是 介绍 IPv4 编 址 的 优秀 读物 。 

然而 ， 在 讨论 IP 编 址 之 前 ， 我 们 寄 要 简 述 一 下 主机 与 路 由 带 连 入 网 络 的 方法 ， 
主机 通常 只 有 一 条 链 踏 连接 到 网 络 ; 当主 机 中 的 IP 想 发送 一 个 数据 报时 ， 它 就 在 该 链 路 
上 发 送 。 主 机 与 物理 链 路 之 间 的 边界 叫做 接口 (interface ) 。 现 在 考虑 一 台 路 由 占 及 其 接 
口 。 因 为 路 由 带 的 任务 是 从 链 路 上 接收 数据 报 并 从 某 些 其 他 链 路 转发 出 去 ， 路 由 器 必须 拥 
有 两 条 或 更 多 条 链 路 与 它 连 接 。 路 由 需 与 它 的 任意 一 条 链 路 之 间 的 边界 也 叫做 接口 。 一 台 
路 由 需 因 此 有 多 个 接口 ， 每 个 接口 有 其 链 路 。 因 为 每 台 主 机 与 路 由 融 都 能 发 送 和 接收 IP 
数据 报 ，IP 要 求 每 台 主 机 和 路 由 右 接 口 拥有 自己 的 IP 地 址 。 因 此 ,一 个 IP 地 址 技术 上 是 
与 一 个 接口 相关 联 的 ， 而 不 是 与 包括 该 接口 的 主机 或 路 由 部 相关 联 的 。 

每 个 IP 地 址 长 度 为 32 比特 (等 价 为 4 字 节 ) ， 因 此 总 共有 2 ”个 可 能 的 IP 地 址 。 由 于 
2 “近似 地 表示 10  ， 故 容易 看 出 约 有 40 亿 个 可 能 的 IP 地址 。 这 些 地 址 一 般 按 所 谓 点 分 十 
进 制 记 法 (dotted- decimal notation) 书写 ， 即 地 址 中 的 每 个 字 节 用 它 的 十 进 制 形式 书写 ， 
各 字 节 间 以 句号 (点) 隔 开 。 例 如 ， 考 虑 IP 地 址 193. 32. 216.9，193 是 该 地 址 第 一 个 8 
比特 的 十 进 制 等 价 数 ，32 是 该 地 址 第 二 个 8 比特 的 十 进 制 等 价 数 ， 依 次 类 推 。 因 此 ， 地 址 
193. 32. 216. 9 的 二 进 制 记 法 是 : 

11000001 00100000 11011000 00001001 

在 全 球 因 特 网 中 的 每 台 主 机 和 路 由 器 上 的 每 个 接口 ， 必 须 有 一 个 全 球 唯一 的 IP 地 址 
(在 NAT 后 面 的 接口 除外 ,本 节 结 尾 将 讨论 ) 。 然而 ， 这 些 地 址 不 能 随意 地 上 自由 选择 。 一 
个 接口 的 IP 地 址 的 一 部 分 需要 由 其 连接 的 子 网 来 决定 。 

图 4-15 提供 了 一 个 卫 编 址 与 接口 的 例子 。 在 该 图 中 ， 一 台 路 由 大 3 Tee 
用 于 互联 7 台 主 机 。 仔 细 观 察 分 配给 主机 和 路 由 器 接口 的 IP 地址 ， 有 几 点 需要 注意 。 
图 4-15 中 左上 侧 部 分 的 3 台 主 机 以 及 它们 连接 的 路 由 器 接口 ， 都 有 一 个 形 如 223. Lo ds ax 
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的 IP 地 址 。 这 就 是 说 ， 在 它们 的 IP 地 址 中 ， 最 左 侧 的 24 比特 是 相同 的 。 这 4 个 接口 也 通 
过 一 个 并 不 包含 路 由 器 的 网 络 互联 起 来 。 例 如 ， 该 网 络 能 够 是 一 个 以 太 网 LAN， 在 此 情况 
下 ， 这 些 接口 将 通过 一 台 以 太 网 交换 机 互联 (第 5 章 中 讨论 ) ， 或 者 通过 一 个 无 线 接 入 点 
互联 (第 6 章 中 讨论 ) 。 我 们 此 时 将 这 种 无 路 由 器 连接 这 些 主机 的 网 络 表示 为 一 从 云 ， 在 
第 5、6 章 中 再 深入 这 些 网 络 的 内 部 。 
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图 4-15 接口 地 址 和 子 网 


用 IP 的 术语 来 说 ， 互 联 这 3 个 主机 接口 与 1 个 路 由 器 接 口 的 网 络 形成 一 个 子 网 (sub- 
net) [RFC 950|。( 在 因特网 文献 中 ， 子 网 也 称 为 IP 网 络 或 直接 称 为 网 络 .) IP 编 址 为 这 
个 子 网 分 配 一 个 地 址 : 223.1.1.0/24， 其 中 的 /24 记 法 ， 有 时 称 为 子 网 掩 码 (network 
mask ) ， 指 示 了 32 比特 中 的 最 左 侧 24 比特 定义 了 子 网 地 址 。 因 此 子 网 223. 1. 1.0/24 是 由 
3 MEMEO (223. 1. 1.1. 223. 1. 1.2 40223. 1. 1:3) MILITERE (223.1.1.4) 组 
成 。 任 何其 他 要 连 到 223.1. 1.07/24 网 络 的 主机 都 要 求 其 地 址 具有 223.1. 1. xxx 的 形式 。 
图 4-15 中 显示 了 另外 两 个 网 络 : 223. 1. 2. 0/24 网 络 与 223. 1. 3.0/24 子 网 。 图 4-16 KIRT 
在 图 4-15 中 存在 的 3 个 IP 子 网 . 


_-—223.1.1.0/24 
223,1.2.0/24 .、 








223.1.3.0/24 





图 4-16 子 网 地 址 
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一 个 子 网 的 IP ne CFF AS Jeg BS PE FE GE BL BI — A tH H A BOA Fi 
清 其 中 的 道理 ， 可 考虑 图 4-17， 图 中 显示 了 3 AKAR EP ea. BE 
路 由 器 有 3 个 接口 ， 每 条 点 对 点 链 路 使 用 一 个 ， 一 个 用 于 直接 将 路 由 带 连 接 到 一 对 主机 的 
广播 链 路 。 这 里 出 现 了 几 个 子 网 呢 ? 3 个 子 网 223. 1. 1. 0/24 、223. 1.2.0/24 和 223. 1.3.0/24 
类 似 于 我 们 在 图 4-15 中 遇 到 的 子 网 。 但 注意 到 在 本 例 中 还 有 其 他 3 个 子 网 ， 一 个 子 网 是 
223. 1. 9.0/24 ， 用 于 连接 路 由 融 RI 与 R2 的 接口 ; 另外 一 个 子 网 是 223. 1. 8.0/24， 用 于 连 
fee at R2 与 R3 的 接口 ; 第 三 个 子 网 是 223. 1.7.0/24， 用 于 连接 路 由 带 R3 与 R1 的 接 
口 ， 对 于 一 个 路 由 大 和 主机 的 通用 互联 系统 ,我 们 能 够 使 用 下 列 有 效 方法 定义 系统 中 的 
为 了 确定 子 网 ， 分 开 主 机 和 路 由 器 的 每 个 接口 ， 产 生 几 个 隔离 的 网 络 助 ， 使 
用 接口 端 接 这 些 隔离 的 网 络 的 端点 这些 隔 离 的 网 络 中 的 每 一 个 都 叫做 一 个 子 网 
( subnet ) 


PA A P A 223.1.1.4 








= = 


223.1.2.1 pp 1.2.2 2 PE A 


图 4-17 3 AHAH KO 个子 网 


如 果 我 们 将 该 过 程 用 于 图 4-17 中 的 互联 系统 上 ， 我 们 会 得 到 6 个 岛 或 子 网 . 

从 上 述 讨论 可 见 ， 一 个 具有 多 个 以 太 网 段 和 点 对 点 链 路 的 组 织 ( 如 一 个 公司 或 学 术 机 
H) 将 具有 和 多 个 子 网 ， 在 给 定子 网 上 的 所 有 设备 都 具有 相同 的 子 网 地 址 。 原 则 上 ,不同 的 
子 网 能 够 具有 完全 不 同 的 子 网 地 址 。 然 而 ， 在 实践 中 ， 它 们 的 子 网 地 址 经 常 有 许多 共同 之 
处 。 为 了 理解 其 中 的 道理 ， 我 们 来 关注 在 全 球 因 特 网 中 是 如 何 处 理 编 址 的 . 

因特网 的 地 址 分 配 和 策略 被 称 为 无 类 别 域 间 路 由 选择 (Classless Interdomain Routing, 
CIDR) [RFC 4632], CIDR 将 子 网 寻 址 的 概念 一 般 化 了 。 因 为 对 于 子 网 寻 址 ，32 比特 的 
IP 地 址 被 划分 为 两 部 分 ， 并且 也 具有 点 分 十 进 制 数 形式 a. b. c. dL/x， 其 中 x 指示 了 地 址 的 
第 一 部 分 中 的 比特 数 。 
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形式 为 a. b. c. d/x 的 地 址 的 * 最 高 比特 构成 了 了 趾 地 址 的 网 络 部 分 ， 并 且 经 党 被 称 为 该 
地 址 的 前 缀 (prefix) (或 网 络 前 级)。 一 个 组 织 通 第 被 分 配 一 块 连续 的 地 址 ， 即 具有 相同 
前 组 的 一 段 地 址 (参见 “实践 原则 ”) 。 在 这 种 情况 下 ， 该 组 织 内 部 的 设备 的 IP 地址 将 共 
享 共同 的 前 级 。 当 我 们 在 4.6 节 中 论 及 因特网 的 BGP 路 由 选择 协议 时 ， 将 看 到 该 组 织 网 络 
外 部 的 路 由 器 仅 考虑 前 面 的 前 缀 比特 *。 这 相当 大 地 减少 了 在 这 些 路 由 需 中 转发 表 的 长 度 ， 
因为 形式 为 a.b. c. d/x 单一 表 项 足以 将 数据 报 转 发 到 该 组 织 内 的 任何 目的 地 ， 


这 是 一 个 JSP 将 8 个 组 织 连接 到 因特网 的 例子 ， 它 也 很 好 地 说 明了 仔细 分 配 CIDR 
化 的 地 址 有 利于 路 由 选择 的 道理 ,如 图 4-18 所 示 ， 假设 该 ISP (我 们 称 之 为 Fly- By- 
Night-ISP) 向 外 界 通告 ， 它 应 该 发 送 所 有 地 址 的 前 20 比特 与 200. 23. 16.0/20 相符 的 数 
据 报 、 外 界 的 其 他 部 分 不 需要 知道 在 地 址 块 200. 23. 16.0/20 内 实际 上 还 存在 8 个 其 他 
组 织 ， 每 个 组 织 有 自己 的 子 网 、 这 种 使 用 单个 网 络 前 缓 通告 多 个 网 络 的 能 力 通 第 称 为 地 
址 聚合 (address aggregation ) ， 也 称 为 路 由 聚合 (route aggregation) 或 路 由 摘要 (route 
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组 织 0 
200.23.16.0/23 


组 织 | i “向 我 发 送 以 
200.23.16.0/20 
200.23.18.0/23 开始 的 任何 东西 ” 
er 


组 织 2 Fly-By-Night-ISP 


200.23.20.0/23 LQ 


因特网 
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199.31.10.0/16 
开始 的 任何 东西 ” 
| te se sonoma am 


Dii eN 
Hai ISPs-R-Us 
ees: 

ee 


图 4-18 层次 编 址 与 路 由 聚合 


当地 址 按 块 分 给 ISP， 然 后 又 由 ISP 分 给 客户 组 织 时 ， 地 址 聚合 工作 极为 有 效 。 但 
是 当地 址 不 是 按 这 样 的 层次 方式 分 配 时 ， 会 出 现 什 么 情况 呢 ? 例如 ， 如 果 Fly- By- Night- 
ISP 获取 了 ISPs-R-Us， 然 后 让 组 织 1 通过 它 辅 助 的 ISPs-R-Us 与 因特网 相连 ， 将 会 发 生 
什么 情况 呢 ? 如 图 4-18 中 所 示 ， 该 辅助 的 ISPs-R-Us 拥有 地 址 块 199. 31.0.0/16， 但 很 
遗憾 的 是 组 织 1 的 IP 地 址 在 该 地 址 块 之 外 。 这 里 可 以 采取 什么 措施 呢 ? 组织 1 无疑 可 以 
将 其 所 有 的 路 由 器 和 主机 重新 编号 ， 使 得 地 址 在 ISPs- R- Us 的 地 址 块 内 ， 但 这 是 一 种 代 
价 很 高 的 方案 ， 而 且 组 织 1 将 来 也 许 还 会 从 ISPs-R- Us 更 换 到 另 一 个 JSP。 通常 采用 的 
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做 法 是 ， 组 织 1 保持 其 IP 地 址 在 200. 23.18.0/23 内 .在 这 种 情况 下 ， 如 图 4-19 所 示 ， 
Fly- By- Night- ISP 继续 通告 地 址 块 200. 23. 16. 0/20, # E ISPs- R- Us 也 继续 通告 地 址 块 
199. 31. 0. 0/16。 然 而 ，ISPs-R-Us 现在 还 要 通告 组 织 1 的 地 址 块 200. 23.18.0/23, HH 
更 大 的 因特网 上 的 其 他 路 由 器 看 见地 址 块 200. 23. 16.0/20 (来 自 Fly- By- Night-ISP) 和 
200. 23. 18.0/23 (来 自 ISPs-R-Us)， 并 且 想 路 由 选择 到 在 地 址 块 200. 23. 18. 0/23 内 的 
一 个 地 址 时 ， 它 们 将 使 用 一 个 最 长 前 缓 匹配 (参见 4.2.2 节 )， HAA ISPs-R-Us 路 由 ， 
因为 它 通告 了 与 目的 地 址 相 匹配 的 最 长 (RAK) 的 地 址 前 缓 。 
组 织 0 
200.23.16.0/23 


组 织 2 “向 我 发 送 以 

200.23.20.0/23 ee 200.23.16.0/20 

| 开始 的 任何 东西 ” 
n ee 





组 织 7 Fly-By-Night-ISP 
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组 织 1 199.31.10.0/16 
200.23.18.0/23 或 200.23.18.0/23 
ss 
jpa ISPs-R-Us et a ncn 
_ -一 一 
en 


Fel 4-19  ISPs-R-Us 具有 到 组 织 1 的 一 条 更 具体 的 路 由 


一 个 地 址 的 剩余 32 -x 比特 可 认为 是 用 于 区 分 该 组 织 内 部 设备 的 ， 其 中 的 所 有 设备 具 
有 相同 的 网 络 前 组 。 当 该 组 织 内 部 的 路 由 需 转 发 分 组 时 ， 才 会 考虑 这 些 比 特 。 这 些 较 低 阶 
比特 可 能 (或 可 能 不 ) 具有 另外 的 子 网 结构 ， sl ee de ni 例如 ， 假 设 某 CIDR 
化 的 地 址 a. b. c. d/21 的 前 21 比特 定义 了 该 组 织 的 网 络 前 级 ， 它 对 该 组 织 中 的 所 有 主机 的 
IP 地 址 来 说 是 共同 的 。 其 余 的 11 比特 标识 了 该 组 织 内 的 主机 。 该 组 织 的 内 部 结构 可 以 采 
用 这 样 的 方式 ， 使 用 这 最 右边 的 11 比特 在 该 组 织 中 划分 子 网 ， 就 像 前 面 所 讨论 的 那样 。 
(ON, a. b. c. d/24 可 能 表示 该 组 织 内 的 特定 子 网 . 

在 CIDR 被 采用 之 前 ，IP 地 址 的 网 络 部 分 被 限制 为 长 度 为 8、16 或 24 比特 ， 这 是 一 种 
称 为 分 类 编 址 (classful addressing) 的 编 址 方案 ， 这 是 因为 具有 8、16 和 24 比特 子 网 地 址 
B 和 C 类 网 络 。 一 个 IP 地 址 的 网 络 部 分 正好 为 1、2 或 3 hn 
K, 已 经 在 支持 数量 迅速 增加 的 具有 小 规模 或 中 等 规模 子 网 的 组 织 方面 出 现 了 问题 ，。 
C 类 (/24) 子 网 仅 能 容纳 多 达 2 -2 =254 台 主 机 (2° =256, PRR AER RT 
特殊 用 途 ) ， 这 对 于 许多 组 织 来 说 太 小 了 。 然而 一 个 B 类 (/16) 子 网 可 支持 多 达 65 534 
台 主 机 ， 又 太 大 了 。 在 分 类 编 址 方法 下 ， 比 方 说 一 个 有 2000 台 主 机 的 组 织 通常 被 分 给 一 
BA (/16) 地 址 。 这 就 导致 了 B 类 地 址 空间 的 迅速 损耗 以 及 所 分 配 的 地 址 空间 的 利用 
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率 低 。 例 如 ， 为 具有 2000 人 台 主 机 的 组 织 分 配 了 一 个 B 类 地 址 ， 就 具有 足以 支持 多 大 
65 534 个 接口 的 地 址 空间 ， 剩 下 的 超过 63 OOO 个 地 址 却 不 能 被 其 他 组 织 使 用 

如 末 还 不 提 太 男 一 种 类 型 的 IP 地址 ， 即 IP 广播 地 址 255. 255. 255.255, ， 那 将 是 我 们 
的 不 负责 任 。 当 一 台 主 机 发 出 一 个 目的 地 址 为 255. 255. 255. 255 的 数据 报时 ， 该 报 文 会 交 
付 给 同一 个 网 络 中 的 所 有 主机 。 路 由 融 也 会 有 选择 地 问 邻 近 的 子 网 转发 该 报 文 (虽然 它们 
通常 不 这 样 做 )， 

此 时 已 经 详细 地 学 习 IP 编 址 ， 我 们 需要 知道 主机 或 子 网 最 初 是 如 何 得 到 它们 的 地 址 
的 。 我 们 先 看 一 个 组 织 是 如 何 为 其 设备 得 到 一 个 地 址 块 的， 然后 再 看 一 个 设备 (如 一 台 主 
机 ) 是 如 何 从 某 组 织 的 地 址 块 中 分 配 到 一 个 地 址 的 。 

1. 获取 一 块 地 址 

为 了 获取 一 块 IP 地 址 用 于 一 个 组 织 的 子 网 ， 某 网 络 管理 员 也 许 首 先 会 与 他 的 ISP Hk 
系 ， 该 ISP 可 能 会 从 已 分 给 它 的 更 大 地 址 块 中 提供 一 些 地 址 。 例 如 ， 该 ISP 也 许 自己 已 被 
分 配 了 地 址 块 200. 23. 16. 0/20, 1% ISP 可 以 依次 将 该 地 址 块 分 成 8 个 长 度 相 等 的 连续 地 址 
块 ， 为 本 ISP 文 持 的 最 多 达 8 个 组 织 中 的 一 个 分 配 这 些 地 址 块 中 的 一 块 ， 如 下 所 示 。 (为 
了 便于 查看 ， 我 们 已 将 这 些 地 址 的 网 络 部 分 加 了 下 划 线 。) 

ISP 的 地 址 块 ”200. 23. 16. 0/20 11001000 00010111 00010000 00000000 





组 织 0 200. 23. 16. 0/23 1 1001000 00010111 00010000 00000000 
组 织 | 200. 23. 18. 0/23 11001000 00010111 00010010 00000000 
组 织 2 200. 23. 20: 0723 11001000 00010111 00010100 00000000 
组 织 7 200. 23. 30. 0/23 11001000 00010111 00011110 00000000 





尽管 从 一 个 ISP 获取 一 组 地 址 是 得 到 一 块 地 址 的 一 种 方法 ， 但 这 不 是 唯一 的 方法 。 显 
然 ， 必 须 还 有 一 种 方法 供 ISP 本 映 得 到 一 块 地 址 。 是 否 有 一 个 全 球 性 的 权威 机 构 ， 它 具有 
管理 UP 地 址 空间 并 向 各 ISP 和 其 他 组 织 分 配 地 址 块 的 最 终 责任 呢 ? 的 确 有 一 个 ! IP 地 址 
由 因特网 名 字 和 编号 分 配 机 构 (Internet Corporation for Assigned Names and Numbers, 
ICANN) [ICANN 2012] 管理 ， 管理 规 则 基于 | RFC 2050 | 。 非 营利 的 ICANN 组 织 | NTIA 
1998| 的 作用 不 仅 是 分 配 IP 地 址 ， 还 管理 DNS 根 服务 需 。 它 还 有 一 项 容易 引起 争论 的 工 
作 ， 即 分 配 域名 与 RRRA Fo ICANN 回 区 域 性 因特网 注册 机 构 (如 ARIN, RIPE, 
APNIC 和 LACNIC) 分 配 地 址 ， 这 些 机 构 一 起 形成 了 ICANN 的 地 址 支持 组 织 | ASO- ICANN 
2012」， 处 理 本 地 域内 的 地 址 分 配 / 管 理 。 

2. 获取 主机 地 址 : 动态 主机 配置 协议 

人 
址 。 系 统管 理 员 通 常 手工 配置 路 由 器 中 的 IP 地址 (常常 在 远程 通过 网 络 管理 工具 进行 配 
窒 ) 。 主 机 地 址 也 能 手动 配置 ， 但 是 这 项 任务 目前 通常 更 多 的 是 使 用 动态 主机 配置 协议 
(Dynamic Host Configuration, DHCP) | RFC 2131] 来 完成 。DHCP 人 允许 主机 目 动 获 取 (被 
分 配 ) 一 个 IP 地 址 。 网 络 管理 员 能 够 配置 DHCP， 以 使 某 给 定 主机 每 次 与 网 络 连 接 时 能 得 

一 个 相同 的 TP 地 址 ， 或 者 某 主 机 将 被 分 配 一 个 临时 的 IP 地址 (temporary IP address) , 

该 地 址 在 每 次 与 网 络 连接 时 也 许 是 不 同 的 。 除 了 主机 IP 地 址 分 配 外 ，DHCP 还 允许 一 台 主 
机 得 知 其 他 信息 ， 例 如 它 的 子 网 掩 码 、 它 的 第 一 跳 路 由 兰 地 址 〈 第 称 为 默认 网 关 ) 与 它 的 
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本 地 DNS 服务 需 的 地 址 

由 于 DHCP 具有 能 将 主机 连接 进 一 个 网 络 的 网 络 相关 方面 的 目 动能 ， 故 它 又 常 被 称 
为 即 插 即 用 协议 (plug-and-play protocol ) ， 这 种 能 力 对 于 网 络 管理 员 ae 常 有 吸引 力 ， 
否则 他 将 不 得 时 不 手工 执行 这 些 任务 ! DHCP 还 沁 地 使 用 于 住宅 因特网 接 入 网 与 无 线 局 域 
风 中 ， 其 中 的 主机 频 凤 地 加 入 和 离开 网 络 。 例 如 ， 考 虑 一 个 学 生 市 着 便携 机 从 箱 舍 到 图 书 
馆 再 到 教室 。 很 有 可 能 在 每 个 位 置 ， 这 个 学 生 将 连接 到 一 个 新 的 子 网 ， 因 此 在 每 个 位 置 都 
需要 一 个 新 的 IP eh DHCP 在 此 情形 下 是 最 理想 的 方法 ， 因 为 有 许多 用 户 来 来 往往 ， 仅 
在 有 限 的 时 间 内 需要 地 址 。 类 似 地 ，DHCP 在 住宅 ISP 接 入 网 中 是 有 用 的 。 举 一 个 例子 ， 
一 个 住宅 区 ISP 有 2000 个 客户 ， 但 不 会 有 超过 400 个 客户 同时 在 线 。 在 这 种 情况 下 ， 动 态 
地 分 配 地 址 的 DHCP 服务 需 不 需要 一 个 含 2048 个 地 址 的 块 ， 而 仅 需 一 个 含 512 个 地 址 的 
块 (例如 像 形 式 为 a. b. c. d/23 的 块 ) 。 当 主机 加 入 或 离开 时 ，DHCP 服务 器 要 更 新 其 可 用 
的 IP 地 址 表 。 每 当 一 台 主 机 加 入 时 ，DHCP 服务 器 从 其 当前 可 用 的 地 址 池 中 分 配 一 个 任意 
的 地 址 给 它 ; 每 当 一 台 主 机 离开 时 ， 其 地 址 便 被 收回 这 个 池 中 。 

DHCP 是 一 个 客户 -服务 器 协议 。 客户 通常 是 新 达到 的 主机 ， 它 要 获得 包括 自身 使 用 
的 IP 地址 在 内 的 网 络 配 置信 息 。 在 最 简单 场合 下 ， 每 个 子 网 (在 图 4-17 的 编 址 意义 下 ) 
将 具有 一 台 DHCP 服务 器 。 如 果 在 某 子 网 中 没有 服务 器 ， 则 需要 一 个 DHCP 中 继 代理 ( 通 
We TBH ai) 这 个 代理 知道 用 于 该 网 络 的 DHCP Wk A AY HE. BI 4-20 显示 了 连接 
于 网 223. 1. 2/24 的 一 台 DHCP 服务 硕 ， 具 有 一 台 提 供 中 继 代 理 服 务 的 路 由 需 ， 它 为 连 
接 到 子 网 223. 1. 1/24 和 223. 1. 3/24 的 到 达 客 户 提供 DHCP 服务 。 在 我 们 下 面 的 讨论 中 ， 
将 假定 DHCP 服务 器 在 该 子 网 上 是 可 供 使 用 的 。 
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293, we i. m 
图 4-20 DHCP 客户 - 服务 器 场景 
对 于 一 人 台新 到 达 的 主机 而 言 ， 针 对 图 4-20 所 示 的 网 络 设置 ，DHCP 协议 是 一 个 4 个 步 
又 的 过 程 ， 如 图 4-21 中 所 示 。 在 这 幅 图 中 ，yiaddr (表示 “你 的 因特网 地 址 ”之 意 ) 指示 
被 分 配给 该 新 到 达 客户 的 地 址 。 
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Lifetime: 3600 secs 


时 问 时 间 
图 4-21 DHCP P - ARS 8h 2c ! 


这 4 个 步骤 是 ; 
e DHCP 服务 器 发 现 . 一 台新 到 的 主机 的 首要 任务 是 发 现 一 个 要 与 其 交互 的 DHCP 


Ale 33 #8 - ae ea ok DHCP 发 现 报 文 (DHCP discover message) 来 完成 ， 

客户 在 UDP 分 组 中 向 端口 67 发 送 该 发 现 报 文 。 但 是 这 个 数据 报应 发 给 谁 呢 ? E 
机 其 至 不 知道 它 所 连接 网 络 的 IP 地址 ， 更 不 用 说 用 于 该 网 络 的 DHCP 服务 谷地 址 
T. 在 这 种 情况 下 ，DHCP 客户 生成 包含 DHCP 发 现 报 文 的 IP 数据 报 ， 其 中 使 用 
广播 目的 地 址 255. 255. 255. 255 并 且 使 用 “本 主机 ” 源 地 址 0. 0.0.0。DHCP 客户 
将 该 IP 数据 报 传递 给 链 路 层 ， 链 路 层 然后 将 该 帧 广播 到 所 有 与 该 子 网 连接 的 子 网 
(我 们 将 在 5.4 PEREEMA REJAT ) 。 

DHCP 服务 器 提供 。DHCP 服务 顺 收 到 一 个 DHCP 发 现 报 文 时 ， 用 一 个 DHCP 提供 
报 文 (DHCP offer message) 回 客 户 作 出 啊 应 ， 仍 然 使 用 IP 广播 地 址 255. 255. 255. 255. 
(你 也 许 要 思考 一 下 这 个 服务 器 为 何 也 必须 采用 广播 -) 因为 在 子 网 中 可 能 有 几 个 
DHCP 服务 器 ， 该 客户 也 许 会 发 现 它 处 于 能 在 几 个 提供 者 之 间 进 行 选择 的 优越 位 
置 。 每 台 服 务 器 提供 的 报 文 包 含有 收 到 的 发 现 报 文 的 事务 ID 、 回 客户 推荐 的 下 地 
址 、 网 络 掩 码 以 及 IP 地 址 租用 期 (address lease time), ED IP Hik A OC AY AY [eB] i 
服务 器 租用 期 通常 设置 为 几 小 时 或 几 天 [ Droms 2002 | 。 

DHCP 请 求 。 新 到 达 的 客户 从 一 个 或 多 个 服务 需 提 供 中 选择 一 个 ， 并 回 选 中 的 服务 
器 提供 用 一 个 DHCP 请 求 报 文 (DHCP request message ) eh we, la ACS Ba. 
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e DHCP ACK, 服务 器 用 DHCP ACK 报 文 (DHCP ACK message) 对 DHCP 请 求 报 文 
进行 响应 ， 证 实 所 要 求 的 参数 。 

一 旦 客户 收 到 DHCP ACK 后 ， 交 互 便 完成 卫 ， 并 且 该 客户 能 够 在 租用 期 内 使 用 DHCP 
分 配 的 IP 地 址 。 因 为 客户 可 能 在 该 租用 期 超时 后 还 希望 使 用 这 个 地 址 ， 所 以 DHCP 还 提 
供 了 一 种 机 制 以 允许 客户 更 新 它 对 一 个 TP 地 址 的 租用 ， 

考虑 到 作为 人 工 配 置 主机 的 趾 地 址 的 奉 代 方法 ，DHCP 的 即 捕 即 用 能 力 的 价值 是 显 而 
匈 见 的 。 考 虞 这 样 的 情况 : 一 个 学 生 市 着 便携 机 从 教室 移动 到 图 书馆 、 答 舍 ， 每 到 新 的 位 
置 就 加 和 一 个 新 的 网 络 并 获得 一 个 新 的 下 地址， 如 果 在 每 个 位 置 都 要 系统 管理 员 重 新 配 
置 便 携 机 ， 而 且 很 少 有 学 生 (上 过 计算 机 网 络 课程 的 学 生 除 外 ) 有 手工 配置 其 计算 机 的 经 
验 ， 这 种 情况 简直 是 不 可 想象 的 。 然 而 ， 从 移动 性 角度 看 ，DHCP 确实 有 不 足 之 处 .因为 
每 当 结 点 连 到 一 个 新 子 网 时 ， 要 从 DHCP 得 到 一 个 新 的 IP 地 址 ， 当 一 个 移动 结 点 在 子 网 
之 间 移 动 时 ， 就 不 能 维持 与 远程 应 用 之 间 的 TCP 连接 。 在 第 6 章 中 ， 我 们 将 研究 移动 IP， 
它 是 一 种 对 IP 基础 设施 的 近期 扩展 ， 人 允许 移动 结 点 在 网 络 之 间 移 动 时 能 使 用 其 单一 永久 
的 地 址 。 有 关 DHCP 的 其 他 细节 可 在 [ Droms 2002] 5 [dhe 2012] 中 找到 .一 个 DHCP 
开放 源码 参考 实现 可 从 因特网 系统 协会 [ISC 2012] 得 到 。 

3. 网 络 地 址 转换 

讨论 了 有 关 因 特 网 地 址 和 IPv4 数据 报 格式 后 ， 我 们 现在 可 清楚 地 认识 到 每 个 IP 使 能 
的 疏 备 都 需要 一 个 卫 地 址 。 随 着 所 谓 小 型 办 公 室 、 家 庭 办 公 室 ( Small OfFice, Home 
Office, SOHO) 子 网 的 大 量 出 现 ， 这 看 起 来 意味 着 每 当 一 个 SOHO 想 安装 一 个 LAN 以 互 
KE aL ARAY , fa ISP 分 配 一 组 地 址 以 供 该 SOHO 的 所 有 机 器 使 用 。 如 果 该 子 网 变 大 了 
(例如 家 里 的 孩子 们 不 仅 有 上 自己 的 计算 机 ， 而 且 还 有 智能 手机 、 联 网 游戏 机 ) ， 则 震 要 分 配 
一 块 较 大 的 地 址 。 但 如 果 ISP 已 经 为 SOHO 网 络 当 前 地 址 范围 分 配 过 一 块 连续 地 址 该 怎么 
办 呢 ? 并 且 家 硅 主 人 要 (或 应 该 需要 ) 首先 知道 管理 IP 地 址 的 典型 方法 有 哪些 呢 ? 幸运 
的 是 ， 有 一 种 简单 的 方法 越 来 越 广泛 地 在 这 些 情 况 场合 : 网 络 地 址 转换 (Network Address 
Translation, NAT) | RFC 2663; RFC 3022; Zhang 2007 |. 

图 4-22 显示 了 一 台 NAT 使 能 路 由 需 的 运行 情况 。 位 于 家 中 的 NAT 使 能 的 路 由 上 需 有 一 
个 接口 ， 该 接口 是 网 4-22 中 右 侧 所 示 家 庭 网 络 的 一 部 分 。 在 家 庭 网 络 内 的 编 址 就 像 我 们 
在 上 面 看 到 的 完全 一 样 ， 其 中 的 所 有 4 个 接口 都 具有 相同 的 网 络 地 址 10. 0. 0/24。 地 址 空 
加 10.0.0.0/8 是 在 | RFC 1918] 中 保留 的 3 部 分 IP 地 址 空间 之 一 ， 这 些 地 址 用 于 如 图 4-22 
中 的 家 硅 网 络 等 专用 网 络 或 具有 专用 地 址 的 地 域 (realm)。 有 具有 专用 地 址 的 地 域 是 指 其 地 
址 仅 对 该 网 络 中 的 设备 有 意义 的 网 络 。 为 了 明白 它 为 什么 重要 ， 考 虑 有 数 十 万 家 庭 网 络 这 
样 的 事实 ， 许 多 使 用 了 相同 的 地 址 空间 10. 0. 0.0/24。 在 一 个 给 定 家 庭 网 络 中 的 设备 能 够 
使 用 10. 0. 0. 0/24 编 址 彼此 发 送 分 组 。 然 而 ， 转 发 到 家 庭 网 络 之 外 进入 更 大 的 全 球 因 特 网 
的 分 组 显然 不 能 使 用 这 些 地 址 〈 或 作为 源 地 址 ， 或 作为 目的 地 址 ) ， 因 为 有 数 十 万 的 网 络 
使 用 着 这 块 地 址 。 这 就 是 说 ，10. 0. 0.0/24 地 址 仅 在 给 定 的 网 络 中 才 有 意义 。 但 是 如 果 专 
用 地 址 仅 在 给 定 的 网 络 中 才 有 意义 的 话 ， 当 问 或 从 全 球 因 特 网 发 送 或 接收 分 组 ， 地 址 在 何 
处 才 必 须 是 唯一 的 呢 ? 答案 在 于 理解 NAT . 

NAT 使 能 路 由 器 对 于 外 部 世界 来 说 甚至 不 像 一 台 路 由 器 。NAT 路 由 器 对 外 界 的 行为 
反 过 来 就 如 同一 个 具有 单一 IP 地 址 的 单一 设备 。 在 图 4-22 中 ， 所 有 离开 家 庭 路 由 器 流向 
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更 大 因特网 的 报 文 都 拥有 一 个 源 IP 地 址 138. 76. 29.7， 且 所 有 进入 家 庭 的 报 文 都 拥有 同一 
AHAJ IP Hoth 138. 76. 29.7。 从 本 质 上 讲 ，NAT 使 能 路 由 锅 对 外 界 隐 藏 了 家 庭 网 络 的 细 
广 。( 为 外 ， 你 也 许 想 知道 家 胜 网 络 计算 机 是 从 哪儿 得 到 其 地 址 ， 路 由 如 又 是 从 哪儿 得 到 
它 的 单一 IP 地 址 的 。 在 通常 的 情况 下 ， 答 案 是 相同 的 ， 芭 DHCP! 路 巾 需 从 ISP 的 DHCP 
服务 倍 得 到 它 的 地 址 ， 并 且 路 由 带 运 行 一 个 DHCP 服务 硕 ， 为 位 于 NAT-DHCP 路 由 名 控制 
的 家 性 网 络 地 址 空间 中 的 计算 机 提供 地 址 ,) 


NAT SEHR 
WAN 端 


138.76.29.7，3001 10.0.0.1, 3345 








S=128.119.40.186; 80 
D=138.76.29.7, 5001,, 





图 4-22 网 络 地 址 转换 


如 采 从 广域网 到 达 NAT 路 由 如 的 所 有 数据 报 部 有 相同 的 目的 IP 地 址 (特别 是 对 NAT 
路 由 需 广 域 网 一 侧 的 接口 ) ， 那 么 该 路 由 硕 怎 样 知道 它 应 将 某 个 分 组 转发 给 哪个 内 部 主机 
呢 ? 技巧 就 是 使 用 在 NAT 路 由 器 上 的 一 张 NAT 转换 表 (NAT translation table) ， 并 且 在 表 
项 中 包含 了 端口 号 及 其 IP 地 址 。 

考虑 图 4-22 中 的 例子 。 假 设 一 个 用 户 坐 在 家 庭 网 络 主机 10. 0. 0. 1 旁 ， 请 求 IP 地 址 为 
128. 119. 40. 186 的 某 台 Web 服务 器 (端口 80) 上 的 一 个 Web 页 面 。 主机 10. 0.0.1 为 其 
指派 了 (任意) Wit 3345 并 将 该 数据 报 发 送 到 LAN 中 。NAT 路 由 天 收 到 该 数据 报 ， 
为 该 数据 报 生 成 一 个 新 的 源 端 口号 5001， 将 源 IP 替代 为 其 广域网 一 侧 接口 的 IP 地址 
138. 76. 29.7， 且 将 源 端口 3345 更 换 为 新 端口 5001 。 当 生成 一 个 新 的 源 端 口号 时 ，NAT 路 
由 带 可 选择 任意 一 个 当前 未 在 NAT 转换 表 中 的 源 端口 号 ， (注意 到 因为 闯 口 号 字段 为 16 
比特 长 ，NAT 协议 可 支持 超过 60 000 个 并 行使 用 路 由 需 广 域 网 一 侧 IP 地 址 的 连接 !1) 路 由 
需 中 的 NAT 也 在 它 的 NAT 转换 表 中 增加 一 表 项 。Web 服务 需 并 不 知道 刚 到 达 的 包含 HTTP 
请 求 的 数据 报 已 被 NAT 路 由 硕 进 行 了 改装 ， 它 会 发 回 一 个 啊 应 报 文 ， 其 目的 地 址 是 NAT 
POR ARAN IP 地 址 ， 其 目的 端口 是 5001。 当 该 报 文 到 达 NAT BR RAY, Me a H KI IP 
地 址 与 目的 端口 号 从 NAT 转换 表 中 检索 出 家 庭 网 络 浏 览 希 使 用 的 适当 了 下 地 址 
(10.0.0.1) 和 目的 端口 号 (3345), 。 于 是 ， 路 由 部 改写 该 数据 报 的 目的 IP 地址 与 目的 病 
口号 ， 并 癌 家 性 网 络 转发 该 数据 报 。 

NAT 在 近 几 年 已 得 到 了 广泛 的 应 用 ,但 是 ,我 们 应 当 提 及 的 是 ,许多 IETF 团体 中 的 
纯化 论 者 大 声 疾 呼 反 对 NAT。 第 一 ， 他 们 认为 端口 号 是 用 于 进程 编 址 的 ， 而 不 是 用 于 主机 
编 址 的 。 (这 种 违规 用 法 对 于 运行 在 家 庭 网 络 中 的 服务 器 来 说 确实 会 引起 问题 ， 因 为 我 们 
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已 在 第 2 章 看 到 ， 服 务 需 进程 在 周知 端口 号 上 等 待人 请 求 .) SB, WATAK EK a 
仅 应 当 处 理 高 达 第 三 层 的 分 组 。 第 三 ， 他 们 认为 NAT 协议 违反 了 所 谓 端 到 端 原则 ， 即 主 
机 彼此 应 相互 直接 对 话 ， 结 点 不 应 介入 修改 IP 地 址 与 端口 号 。 第 四 ， 他们 认为 应 使 用 
IPv6 (参见 4.4.4 节 ) 来 解决 IP 地 址 短缺 问题 ， 而 不 是 不 计 后 果 地 用 一 种 如 NAT 之 类 的 
权宜 之 计 来 修补 存在 的 问题 。 但 不 管 豆 欢 与 否 ，NAT 已 成 为 因特网 的 一 个 重要 组 件 。 

NAT 的 男 一 个 重要 问题 是 它 妨 碍 P2P 应 用 程序 ， 包 括 P2P 文件 共享 应 用 和 P2PIP 语音 
应 用 . 第 2 章 讲 过 在 一 个 P2P 应 用 程序 中 ， 任 何 参 与 对 等 方 A 应 当 能 够 对 任何 其 他 参与 对 
等 方 B 发 起 一 条 TCP 连接 。 该 问题 的 实质 在 于 如 果 对 等 方 B 在 一 个 NAT 后 面 ， 它 不 能 充 
GARE ae FEE TCP 连接 。 如 我 们 将 在 课 后 习题 中 所 见 ， 如 果 对 等 方 A 不 在 一 个 NAT 的 
后 面 ， 则 该 NAT 问题 能 够 绕 过 去 。 在 这 种 情况 下 ， 对 等 方 A 能 够 首先 通过 一 个 中 间 对 等 
方 C 与 对 等 方 B 联系 ， 其 中 C 不 位 于 NAT 之 后 并 与 B 已 经 创建 了 一 条 进行 中 的 TCP 连 
接 。 对 等 方 A 则 能 够 经 对 等 方 C 请 求 对 等 方 B， 发 起 直接 返回 对 等 方 A 的 一 条 TCP 连接 。 
一 旦 对 等 方 A 和 B 之 间 创 建 一 条 直接 的 P2P TCP 连接 ， 这 两 个 对 等 方 就 能 够 交换 报 文 或 
文件 。 这 种 雇佣 关系 被 称 为 连接 反 转 (connection reversal ,， 实 际 上 被 许多 P2P 应 用 程序 用 
F NAT 穿越 (NAT traversal) 。 如 果 对 等 方 A 和 对 等 方 B 都 在 它们 自己 的 NAT 后面， 这 种 
情况 有 些 琼 手 ， 但 是 能 够 使 用 应 用 程序 进行 中 继 处 理 ， 正 如 我 们 在 第 2 曹 中 对 于 Skype 中 
继 所 见 到 的 那样 。 

4. UPnP 

NAT 穿越 正 越 来 越 多 地 由 通用 即 插 即 用 (UPnP) $e, UPnP 是 一 种 允许 主机 发 现 并 
配置 邻近 NAT 的 协议 [ UPnP Forum 2012], UPnP 要 求 主机 和 NAT 都 是 UPnP 兼容 的 。 使 
用 UPnP, 在 主机 上 运行 的 应 用 程序 能 够 为 某 些 请 求 的 公共 端口 号 请 求 一 个 NAT 上 映射， 该 
映射 位 于 其 (专用 IP 地 址 ， 专 用 端口 号 ) 和 (公共 IP 地址 ， 公 共 端 口号 ) 之 间 。 如 果 某 
NAT 接受 该 请 求 并 生成 映射 ， 则 来 自 外 部 的 结 点 能 够 发 起 到 (A IP 地址 ， 公 共 端 口号 ) 
的 TCP 连接 。 此 外 ，UPnP 让 该 应 用 程序 知道 (公共 IP 地 址 ， 公 共 端 口号 ) ， 因 此 该 应 用 
程序 能 够 回 外 部 世界 通告 它 。 

举 一 个 例子 ， 假 定 你 的 主机 位 于 一 个 UPnP 使 能 的 NAT 背后， 具有 专用 地 址 10. 0. 0. 1 
并 且 在 端口 3345 上 运行 BitTorrent。 另 外 假定 该 NAT 的 公共 IP 地 址 是 138. 76. 29.7。 你 的 
BitTorrent 应 用 程序 自然 要 能 够 接受 来 自 其 他 主机 的 连接 ， 使 得 它 能 够 同 其 他 主机 对 换 块 。 
此 后 ， 你 主机 上 的 BitTorrent 应 用 程序 请 求 NAT 产生 一 个 “ 洞 ?>， 将 (10. 0.0.1，3345 ) 
eye (138. 76. 29.7，5001 ) 。 (该 应 用 程序 选择 了 公共 端口 号 S001.) 在 你 主机 中 的 Bit- 
Torrent 应 用 程序 也 能 人 够 向 它 的 追踪 融通 告 它 在 〈138. 76. 29.7，5001) 可 供 使 用 。 以 这 种 
方式 ， 运 行 BitTorrent 的 一 台 外 部 主机 能 够 联系 该 追踪 大， 并 知道 你 的 BitTorrent 应 用 程序 
正 运行 在 (138. 76. 29.7，5001)。 该 外 部 主机 能 够 向 (138.76.29.7, 5001) 发 送 TCP 
SYN 分 组 。 当 NAT 接收 到 该 SYN 分 组 ， 它 将 改变 分 组 中 的 目的 IP 地 址 和 端口 号 ， 并 通过 
NAT 转发 分 组 。 

总 而 言 之 ，UPnP 允许 外 部 主机 使 用 TCP 或 UDP 向 NAT 化 的 主机 发 起 通信 会 话 。 长 
期 以 来 NAT 一 二 对 P2P 应 用 程序 十 分 不 利 ; UPnP 由 于 提供 了 了 有效 和 健壮 的 NAT 穿越 解决 
方案 ， 可 能 成 为 了 P2P 应 用 程序 的 救世 主 。 这 里 我 们 对 NAT 和 UPnP 的 讨论 十 分 人 简要， 对 
于 NAT 更 为 详细 的 讨论 参见 | Huston 2004; Cisco NAT 2012 | 。 
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4.4.3 因特网 控制 报 文 协议 


机 面 讲 过 因特网 的 网 络 层 具有 3 个 主要 组 件 : 在 前 面 一 节 中 讨论 的 耳 协 以 ; 在 4.6 7 
中 讨论 的 因特网 路 由 选择 协议 (包括 RIP, OSPF #1 BGP); 以 及 成 为 本 节 主 题 的 因特网 控 
ilik HX (ICMP), 

ICMP 由 | RFC 792| EX, RE BL AS Ar HK Be) a A A A E- ICMP 最 典 
型 的 用 途 是 差错 报告 。 例 如 ， 当 运行 一 个 Telnet 、FTP 或 HTTP 会 话 时 ， 你 也 许 会 遇 到 一 
些 诸如 “目的 网 络 不 可 达 ” 之 类 的 错误 报 文 。 这 种 报 文 就 是 在 ICMP 中 产生 的 。 在 某 个 位 
E, IP 路 由 需 不 能 找到 一 条 路 径 、 以 通 往 Telnet, FTP 或 HTTP 应 用 所 指定 的 主机 。 该 路 
由 带 就 会 问 你 的 主机 创建 和 发 出 一 个 类 型 3 的 ICMP 报 文 以 指示 该 错误 ， 

ICMP 通 负 被 认为 是 aha (AWA Az EYE EMF IP Z EÉ, WA ICMP 
报 文 古 承载 在 IP 分 组 中 的 : 这 就 是 说 ，ICMP 报 文 是 作为 IP 有 效 载 傈 承载 的 ， 就 像 TCP 
与 UDP 报 文 段 作 为 IP 有 效 载 何 被 承载 那样 。 类 似 地 ， 当 一 台 主 机 收 到 一 个 指明 上 层 协议 
为 ICMP 的 IP 数据 报时 ， 它 分 解 出 该 数据 报 的 内 容 给 ICMP， 就 像 分 解 出 一 个 数据 报 的 内 
容 给 TCP 或 UDP 一 样 。 

ICMP 报 文 有 一 个 类 型 字段 和 一 个 编 仅 字段， 并且 包含 引起 该 ICMP 报 文 首 次 生成 的 
IP 数据 报 的 首部 和 前 8 字 节 内 容 (以 便 发 送 方 能 确定 引发 该 差错 的 数据 报 )。 在 图 4-23 中 
显示 了 所 选 的 ICMP 报 文 类 型 。 注意 到 ICMP 报 文 并 不 仅 是 用 于 遂 知 差错 情况 。 








ICMP 类 型 q 编码 | 描述 


| 
| 
L 
| 








0 | 回 显 回答 (对 ping 的 回答 ) 


0 日 的 网 络 不 可 达 
日 的 主机 不 可 达 





] 
2 目的 协议 不 可 达 
3 目的 端口 不 可 达 





6 目的 网 络 未 知 
7 目的 主机 未 知 
0 源 抑 制 ( PH AE RS il ) 
a 
7 
| 





| 
= 2 


| 1] | 0 TTL 过 期 
| 12 | 0 IP 首部 损坏 





图 4-23 ICMP 报 文 类 型 


众所周知 的 ping 程序 发 送 一 个 ICMP 类 型 8 编码 0 的 报 文 到 指定 主机 。 看 到 该 回 
(echo) R, 日 的 主机 发 回 一 hn de 
接 在 操作 系统 中 支持 ping 服务 器 ， 即 该 服务 器 不 是 一 个 进程 。 [Stevens 1990] 的 第 11 章 
提供 了 有 关 ping 客户 程序 的 源码 。 注 意 客户 程序 需要 能 够 指示 操作 系统 产生 一 个 类 型 8 编 
码 0 的 ICMP 报 文 。 

另 一 个 有 趣 的 ICMP 报 文 是 源 抑 制 报 文 。 这 种 报 文 在 实践 中 很 少 使 用 。 其 最 初 目的 是 
执行 拥塞 控制 ， 即 使 得 拥塞 的 路 由 器 回 一 台 主 机 发 送 一 个 ICMP 源 抑制 报 文 ， 以 强制 该 主 
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机 减 小 其 发 送 速率 。 我 们 在 第 3 章 已 看 到 ，TCP 有 自己 在 运输 层 操 作 的 拥塞 控制 机 制 ， 不 
韦 要 利用 网 络 层 中 的 反馈 信息 (如 ICMP 源 抑制 报 文 ) 。 

在 第 1 章 中 我 们 介绍 了 Traceroute 程序 ， 该 程序 允许 我 们 跟踪 从 一 台 主 机 到 世界 上 任 
意 一 人 台 其 他 主机 之 间 的 路 由 。 有趣 的 是 Traceroute 是 用 ICMP 报 文 来 实现 的 。 为 了 判断 源 
和 目的 地 之 间 所 有 路 巾 融 的 名 字 和 地 址 ， 源 主机 中 的 Traceroute 向 目的 主机 发 送 一 系列 普 
AY 卫 数 据 报 。 这 些 数 据 报 的 每 个 携带 了 具有 一 个 不 可 达 UDP 端口 号 的 UDP 报 文 段 。 第 
一 个 数据 报 的 TTL 为 1， 第 二 个 的 TTL 为 2， 第 三 个 的 TTL 为 3， 依 次 类 推 。 该 源 主 机 也 为 
每 个 数据 报 局 动 定 时 硕 。 当 第 n 个 数据 报到 达 第 nn 台 路 巾 句 时 ， 第 冯 台 路 由 器 观察 到 这 个 
数据 报 的 TTL 正 好 过 期 。 根 据 IP 协议 规则 ， 路 由 带 丢 弃 该 数据 报 并 发 送 一 个 ICMP 告警 报 
文 给 源 主机 (类 型 11 编码 0)。 该 告警 报 文 包含 了 路 由 需 的 名 字 与 它 的 卫 地 址 。 当 该 
ICMP 报 文 返回 源 主机 时 ， 源 主机 从 定时 需 得 到 往返 时 延 ， 从 ICMP 报 文中 得 到 第 n ARK A 
需 的 名 字 与 IP 地 址 。 

Traceroute 源 主机 是 怎样 知道 何 时 停止 发 送 UDP 报 文 段 的 呢 ? 前 面 讲 过 源 主 机 为 它 发 
送 的 每 个 报 文 段 的 TTL 字 段 加 1。 因此， 这 些 数据 报 之 一 将 最 终 沿 着 这 条 路 到 达 目 的 主机 。 
因为 该 数据 报 包 含 了 一 个 具有 不 可 达 端 口号 的 UDP 报 文 端 ， 该 日 的 主机 将 向 源 发 送 一 个 
sig AS AK ICMP 报 文 。 当 源 主 机 收 到 这 个 特别 的 ICMP 报 文 时 ， 知 道 它 不 需要 再 发 送 
为 外 的 探测 分 组 。( 标准 的 Traceroute 程序 实际 上 用 相同 的 TTL 发 送 3 个 一 组 的 分 组 ; 因此 
Traceroute 输出 对 每 个 TTL 提 供 了 3 个 结果 。) 

以 这 种 方式 ， 源 主机 知道 了 位 于 它 与 目的 主机 之 间 的 路 由 器 数量 和 标识 ， 以 及 两 台 主 
机 之 间 的 往返 时 延 。 注 意 Traceroute 客户 程序 必须 能 够 指令 操作 系统 产生 具有 特定 TTL 值 
的 UDP 数据 报 ， 当 ICMP 报 文 到 达 时 ， 也 必须 能 够 由 它 的 操作 系统 进行 通知 。 既 然 你 已 明 
H T Traceroute 的 工作 原理 ， 你 也 许 想 回 去 更 多 地 使 用 它 。 





检查 数据 报 : 防火 墙 和 入 侵 检 测 系 统 


假定 你 被 赋予 了 管理 家 庭 网 络 、 部 门 网 络 、 大 学 网 络 或 公司 网 络 的 任务 。 知 道 你 网 
络 IP 地 址 范围 的 攻击 者 ， 能 够 方便 地 在 此 范围 中 发 送 IP 数据 报 进行 寻 址 。 这 些 数据 报 
能 够 做 各 种 不 正当 的 事情 ， 和 包括 用 ping 搜索 和 端口 扫描 形成 你 的 网 络 图 ， 用 恶意 分 组 使 
p aE, MAER RI ICMP 分 组 洪 泛 服务 器 ， 并 且 通 过 在 分 组 中 带 有 恶 
意 软件 感染 主机 。 作 为 网 络 管理 员 ， 你 准备 做 些 什 么 来 将 这 些 能 够 在 你 的 网 络 中 发 送 恶 
意 分 组 的 坏 家 伙 拒 之 门 外 呢 ? 对 抗 恶意 分 组 攻击 的 两 种 流行 的 防御 措施 是 防火 墙 和 入 侵 
检测 系统 (IDS) 。 

作为 一 名 网 络 管理 员 ， 你 可 能 首先 党 试 在 你 的 网 络 和 因特网 之 间 安 装 一 台 防 火 墙 . 
(今天 大 多 数 接 入 路 由 器 具有 防火 墙 能 力 。) 防火 墙 检查 数据 报 和 报 文 段 首部 字段 ， 拒 绝 
可 疑 的 数据 报 进入 内 部 网 络 。 例如， 一 台 防 火 墙 可 以 被 配置 为 阻挡 所 有 的 ICMP 回 显 请 
求 分 组 ， 从 而 防止 了 攻击 者 横 跨 你 的 IP 地 址 范围 进行 传统 的 ping 搜索 。 防火墙 也 能 基 
于 源 和 目的 了 地 址 和 端口 号 阻挡 分 组 。 此 外 ， 防 火 墙 能 够 配置 为 跟踪 TCP 连接 ， 仅 许 
可 属于 批准 连接 的 数据 报 进入 。 
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IDS 能 够 提供 另 一 种 保护 措施 .IDS 通常 位 于 网 络 的 边界 ， 执 行 “深度 分 组 检查 ”， 不 仅 
检查 数据 报 (包括 应 用 层 数 据 ) 中 的 首部 字段 ， 而 且 检 查 其 有 效 载荷 IDS 具有 一 个 分 组 特 
征 数据 库 (这 些 特征 是 已 知 攻击 的 一 部 分 )。 随 着 新 攻击 的 发 现 ， 该 数据 库 自 动 更 新 特征 . 
当 分 组 通过 IDS 时 ，IDS 试图 将 分 组 的 首部 字段 和 有 效 载荷 与 其 特征 数据 库 中 的 特征 相 匹配 
如 果 发 现 了 这 样 的 一 种 匹配 ， 就 产生 一 个 告警 。 入 侵 防 止 系统 (IPS) 5 IDS 类 似 ， 只 是 除 
了 产生 告警 外 还 实际 阻挡 分 组 .在 第 8 章 中 ,我们 将 更 为 详细 地 研究 防火 墙 和 IDS， 

防火 墙 和 IDS 能 够 全 面 保护 你 的 网 络 免 受 所 有 攻击 吗 ? 答案 显然 是 否定 的 ， 因 为 攻 
击 者 继续 寻找 特征 还 不 能 匹配 的 新 攻击 方法 。 但 是 防火 墙 和 传统 的 基于 特征 的 JIDS 在 保 
护 你 的 网 络 不 受 已 知 攻击 入 侵 方 面 是 有 用 的 。 


4.4.4 IPv6 


在 20 世纪 90 年 代 早期 ， 因 特 网 工程 任务 组 就 开始 致力 于 开发 一 种 替代 IPv4 的 协议 ， 
该 努力 的 最 初 动机 是 因为 以 下 现实 : 由 于 新 的 子 网 和 IP 结 点 以 惊人 的 增长 率 连 到 因特网 
上 (并 被 分 配 唯一 的 IP 地 址 )，32 比特 的 IP 地 址 空间 即将 用 尽 。 为 了 应 对 这 种 对 大 IP 地 
址 空间 的 需求 ， 开 发 了 一 种 新 的 IP 协议 ， 即 IPv6 。IPv6 的 设计 者 们 还 利用 这 次 机 会 ， 在 
IPv4 积累 的 运行 经 验 基础 上 加 进 和 强化 了 IPv4 的 其 他 方面 . 

IPv4 地 址 在 什么 时 候 会 被 完全 分 配 完 (因此 没有 新 的 网 络 再 能 与 因特网 相连 ) 是 一 
个 相当 有 争议 的 问题 。IETF 的 地 址 寿命 期 望 工作 组 的 两 位 负责 人 分 别 估计 地 址 将 于 2008 
年 和 2018 年 用 完 [Solensky 1996]。 在 2011 年 2 H, IANA 向 一 个 区 域 注册 机 构 分 配 完了 
未 分 配 IPv4 地 址 的 最 后 剩余 地 址 池 。 这 些 注册 机 构 在 它们 的 地 址 池 中 还 有 可 用 的 IPv4 地 
址 ,一 旦 用 完 这 些 地 址 ， 从 中 央 池 中 将 再 也 分 配 不 出 更 多 的 可 用 地 址 块 了 [Huston 
2011a] 。 尽 管 在 20 世纪 90 年 代 中 期 对 IPv4 地 址 耗 尽 的 佑 计 表 明 ，IPv4 地 址 空间 耗 尽 的 期 
限 还 有 可 观 的 时 间 ， 但 人 们 认识 到 ， 如 此 大 规模 地 部 署 一 项 新 技术 将 需要 可 观 的 时 间 ， 因 
此 开始 了 下 一 代 IP (Next Generation IP, IPng) 的 工作 [ Bradner 1996; RFC 1752 | ix fH 
工作 成 有 果 就 是 IP 版 本 6 (IPv6) 的 规范 [RFC 2460 | ， 这 是 我 们 下 面 将 要 讨论 的 主题 . 
(一 个 经 常 问 到 的 问题 是 : IPvy5 出 了 什么 情况 ?人 们 最 初 预想 ST-2 协议 将 成 为 IPv5， 但 
ST-2 JR KRG FET.) AK IPv6 的 优秀 信息 来 源 见 [Huitema 1998; IPv6 2012 |. 

1. IPv6 数据 报 格 式 

IPv6 数据 报 的 格式 如 图 4-24 所 示 。 
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IPv6 中 引入 的 最 重要 的 变化 显示 在 其 数据 报 格式 中 : 


扩大 的 地 址 容量 。IPv6 将 IP 地址 长 度 从 32 比特 增加 到 128 比特 。 这 就 确保 全 世 
界 将 不 会 用 尽 IP 地 址 。 现 在 ， 地 球 上 的 每 个 沙砾 都 可 以 用 卫 地 址 寻 址 了 。 除了 单 
播 与 多 播 地 址 以 外 ，IPv6 还 引入 了 一 种 称 为 任 播 地 址 (anycast address) 的 新 型 地 
址 ， 这 种 地 址 可 以 使 数据 报 交 付 给 一 组 主机 中 的 任意 一 个 。( 例如， 这 种 特性 可 用 
于 回 一 组 包含 给 定 文档 的 镜像 站 点 中 的 最 近 的 一 个 发 送 一 个 HTTP GET 报 文 。) 
简化 高 效 的 40 字 节 首部 。 如 下 面 讨论 的 那样 ， 许 多 IPv4 字段 已 被 舍弃 或 作为 选 
项 。 因 而 所 形成 的 40 字 市 定 长 首部 允许 更 快 地 处 理 IP 数据 报 。 一 种 新 的 选项 编 
公允 许 进 行 更 灵活 的 选项 处 理 。 

流标 签 与 优先 级 。IPv6 有 一 个 难以 捉摸 的 流 (flow) 定义 。RFC 1752 与 RFC 2460 
中 摘 述 道 ， 该 字段 可 用 于 “给 属于 特殊 流 的 分 组 加 上 标签 ， 这 些 特殊 流 是 发 送 方 
要 求 进行 特殊 人 处理 的 流 ， 如 一 种 非 默认 服务 质量 或 需要 实时 服务 的 流 ”。 例 如 ， 音 
频 与 视频 传输 就 可 能 被 当 作 一 个 流 。 在 另 一 方面 ， 更 为 传统 的 应 用 (如 文件 传输 
和 电子 邮件 ， 就 不 可 能 被 当 作 流 。 由 高 优先 级 用 户 〈 如 某 些 为 使 其 流量 得 到 更 好 
服务 而 付费 的 用 户 ) 承载 的 流量 也 有 可 能 被 当 作 一 个 流 。 然 而 ，IPv6 的 设计 者 们 
显然 已 预见 到 最 终 需 要 能 够 区 分 这 些 流 ， 即 使 流 的 确切 含义 还 未 完全 确定 。IPv6 
首部 中 还 有 一 个 8 比特 的 流量 类 型 字段 ， 该 字段 就 像 IPv4 中 的 TOS 字段 ， 可 用 于 
给 出 一 个 流 中 某 些 数据 报 的 优先 级 ， 以 便 指 明 某 些 应 用 的 数据 报 (如 ICMP 分 组 ) 
比 其 他 应 用 的 数据 报 (如 网 络 新 闻 ) 有 更 高 的 优先 权 。 


如 上 所 述 ， 比 较 图 4-24 与 图 4-13 就 可 看 出 ，IPv6 数据 报 的 结构 更 简单 、 更 高 效 。 以 
下 是 在 IPv6 中 定义 的 字段 。 


版 本 。 该 4 比特 字段 用 于 标识 IP WAS ZDA, [Pv6 将 该 字段 值 设 为 6。 注 
意 到 将 该 字段 值 置 为 4 并 不 能 创建 一 个 合法 的 IPv4 数据 报 。( 如 果 这 样 的 话 ， 吾 
情 就 简单 多 了 ， 参 见 下面 有 关 从 IPv4 向 IPv6 迁移 的 讨论 。) 

流量 类 型 。 该 8 比特 字段 与 我 们 在 IPv4 中 看 到 的 TOS 字段 的 含义 相似 。 

流标 签 。 如 上 面 讨 论 过 的 那样 ， 该 20 比特 的 字段 用 于 标识 一 条 数据 报 的 流 。 

有 效 载荷 长 度 。 该 16 比特 值 作为 一 个 无 符号 整数 ， 给 出 了 IPv6 数据 报 中 跟 在 定 长 
的 40 字 节 数据 报 首部 后 面 的 字 节 数量 。 

下 一 个 首部 。 该 字段 标识 数据 报 中 的 内 容 (数据 字段 ) 需要 交付 给 哪个 协议 (如 
TCP 或 UDP) 。 该 字段 使 用 与 IPv4 首部 中 协议 字段 相同 的 值 。 

跳 限 制 。 转 发 数据 报 的 每 台 路 由 融 将 对 该 字段 的 内 容 减 1。 如 果 跳 限制 计数 到 达 0 
时 ， 则 该 数据 报 将 被 丢弃 ，。 

源 地 址 和 目的 地 址 。IPv6 128 比特 地 址 的 各 种 格式 在 RFC 4291 中 进行 了 摘 述 。 
数据 。 这 是 IPv6 数据 报 的 有 效 载荷 部 分 。 当 数据 报到 达 目 的 地 时 ， 该 有 效 载 荷 就 
从 IP 数据 报 中 移出 ， 并 交 给 在 下 一 个 首部 字段 中 指定 的 协议 处 理 。 


以 上 讨论 说 明了 IPv6 数据 报 中 包括 的 各 字段 的 用 途 。 图 4-24 中 的 IPv6 数据 报 格式 与 
图 4-13 中 的 IPv4 数据 报 格式 进行 比较 ， 我 们 就 会 注意 到 ， 在 IPv4 数据 报 中 出 现 的 几 个 字 
段 在 IPv6 数据 报 中 已 不 复 存在 : 


分 片 / 重 新 组 装 。IPv6 不 允许 在 中 间 路 由 郑 上 进行 分 片 与 重新 组 装 。 这 种 操作 只 能 
在 源 与 日 的 地 上 执行 。 如 果 路 由 带 收 到 的 IPv6 数据 报 因 太 大 而 不 能 转发 到 出 链 路 
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上 的 话 ， 则 路 由 器 只 需 丢 折 该 数据 报 ， 并 回 发 送 方 发 回 一 个 “分 组 太 大 ”的 ICMP 
差错 报 文 即 可 ( 见 下 文 )。 于 是 发 送 方 能 够 使 用 较 小 长 度 的 IP 数据 报 重 发 数据 。 
分 片 与 重新 组 装 是 一 个 耗 时 的 操作 ， 将 该 功能 从 路 由 融 中 删除 并 放 到 端 系 统 中 ， 
大 大 加 快 了 网 络 中 的 了 转发 速度 。 

e 首部 检验 和 。 因 为 因特网 层 中 的 运输 层 (如 TCP UDP) 和 数据 链 路 层 〈《 如 以 太 
网 ) 协议 执行 了 检验 操作 ， 了 PP 设计 者 大 概 觉 得 在 网 络 层 中 具有 该 项 功能 实 属 多 
余 ， 可 以 将 其 去 除 。 再 次 强调 的 是 ,快速 处 理 下 分 组 是 关注 的 重点 。 在 4.4.1 市 

中 我 们 讨论 IPv4 时 讲 过 ， 由 于 IPv4 首部 中 包含 有 一 个 TTL 字 段 (类 似 于 IPv6 中 的 
中 限制 字段 ) ， 所 以 在 每 台 路 由 需 上 都 需要 重新 计算 IPv4 首部 检验 和 就 像 分 片 
与 重新 组 装 一 样 ， 在 IPv4 中 这 也 是 一 项 耗 时 的 操作 . 

e 选项 。 选 项 字段 不 再 是 标准 IP 首部 的 一 部 分 了 。 但 它 并 没有 消失 ， 而 是 可 能 出 现 
在 IPv6 首部 中 由 “下 一 个 首部 ”指出 的 位 置 上 。 这 就 是 说 ， 就 像 TCP 或 UDP 协 
议 首 部 能 够 是 卫 分 组 中 的 “下 一 个 首部 ”， 选 项 字段 也 能 是 “下 一 个 首部 ”。 删 除 
选项 字段 使 得 IP 首部 成 为 定 长 的 40 FTF 

我 们 在 4. 4. 3 节 讨论 时 讲 过 ，IP 结 点 使 用 ICMP 协议 来 报告 差错 情况 ， 并 回 妆 系统 提 
供 有 限 的 信息 (如 对 一 个 ping 报 文 的 回 显 回答 ) RFC 4443 中 定义 了 一 种 用 于 IPv6 的 新 
版 ICMP，。 除 了 能 识别 现存 的 ICMP 类 型 和 编码 定义 外 ， 由 于 IPv6 新 增 功能 的 需要 ， 
ICMPv6 还 增加 了 新 的 类 型 和 编码 。 其 中 包括 “分 组 太 大 ”类 型 与 “未 识别 的 IPv6 选项 ” 
错误 编码 。 另 外 ，ICMPv6 还 包含 了 我 们 将 在 4.7 节 中 学 习 的 因特网 组 管理 协议 (IGMP) 
IGMP 用 于 管理 主机 加 入 和 离开 多 播 组 ， 它 在 IPv4 中 曾 是 一 个 与 ICMP 分 开 的 独立 协议 。 

2， 从 IPv4 到 IPv6 的 迁移 

既然 我 们 已 了 解 了 IPv6 的 技术 细节 ， 那 么 我 们 考虑 一 个 非常 实际 的 问题 ， 基 于 IPv4 
的 公共 因特网 如 何 迁 移 到 IPv6 呢 ? 问题 是 ， 虽 然 新 型 IPv6 使 能 系统 可 做 成 回 后 兼容 ， 即 
能 发 送 、 路 由 和 接收 IPv4 数据 报 ， 但 已 部 署 的 IPv4 使 能 系统 却 不 能 够 处 理 IPv6 数据 报 。 
可 能 采用 以 下 几 种 方法 。 

一 种 可 选 的 方法 是 宣布 一 个 标志 日 ， 即 指定 某 个 日 期 和 时 间 ， 届 时 因特网 所 有 机 如 都 
关机 并 从 IPv4 升级 到 IPv6。 上 次 重大 的 技术 迁移 (为 得 到 可 靠 的 运输 服务 ， 从 使 用 NCP 
迁移 到 使 用 TCP) 出 现在 差不多 25 年 以 前 。 即 使 回 到 那 时 【RFC 801] 一 一 因特网 很 小 且 
仍然 由 少数 “奇才 ”管理 着 ， 人 们 也 会 认识 到 这 样 一 个 标志 日 是 不 可 行 的 。 一 个 涉及 上 和 亿 
台 机 器 和 上 百 万 个 网 络 管理 员 与 用 户 的 标志 日 现在 更 是 不 可 想象 的 。RFC 4213 描述 了 两 
种 方法 ( 可 单独 使 用 ， 也 可 一 起 使 用 ) ， 可 用 于 逐渐 将 IPv6 EELEE H tt HE IPv4 世界 
中 (当然 其 长 远 目 标 是 将 所 有 IPv4 结 点 最 终 同 IPv6 迁移 )。 

引入 IPv6 使 能 结 点 的 最 直接 方式 可 能 是 一 种 双 栈 (dual- stack ) 方法 ， 即 使 用 该 方法 
的 IPv6 结 点 还 具有 完整 的 IPv4 实现 。 这 样 的 结 点 在 RFC 4213 中 被 称 为 IPv6/IPv4 结 点 ， 
它 有 发 送 和 接收 IPv4 与 IPv6 两 种 数据 报 的 能 力 。 当 与 IPv4 结 点 互 操 作 时 ，IPv6/IPv4 2 
可 使 用 IPv4 数据 报 ; 当 与 IPv6 结 点 互 操 作 时 ， 它 又 能 使 用 IPv6, IPv6/IPv4 结 点 必须 具有 
IPv6 与 IPv4 两 种 地 址 。 此 外 ,它们 还 必须 能 确定 男 一 个 结 点 是 否 是 IPv6 使 能 的 或 仅 IPv4 
使 能 的 。 这 个 问题 可 使 用 DNS (参见 第 2 章 ) 来 解决 ,者 要 解析 的 结 点 名 字 是 IPv6 使 能 
的 ， 则 DNS 会 返回 一 个 IPv6 地 址 ， 否 则 返回 一 个 IPv4 地 址 。 当 然 ， 如 果 发 出 DNS 请 求 的 
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结 点 是 仅 IPv4 使 能 的 ， 则 DNS 只 返回 一 个 IPv4 地 址 。 

在 双 栈 方法 中 ， 如 果 发 送 方 或 接收 方 中 任 意 一 个 仅 为 IPv4 使 能 的 ， 则 必须 使 用 IPv4 
数据 报 。 因 此 ， 本 质 上 两 个 IPv6 使 能 的 结 点 不 应 相互 发 送 IPv4 数据 报 。 图 4-25 中 国 示 了 
这 种 情况 。 假 定 结 点 A 是 IPv6 使 能 的 ， 且 要 癌 结 点 下 发 一 个 IP 数据 报 , 了 也 是 IPv6 使 能 
的 。 结 点 A 和 B 能够 交换 IPv6 数据 报 。 然 而 ， 结 点 B 必须 生成 一 个 IPv4 数据 报 以 便 发 给 
C， 当 然 ，IPv6 数据 报 的 数据 字段 可 被 复制 到 IPv4 数据 报 的 数据 字段 中 ， 并 且 要 做 适当 的 
地 址 映射 。 然 而 ， 在 执行 IPv6 到 IPv4 的 转换 时 ，IPv6 数据 报 中 一 些 IPv6 特定 的 字段 (如 
流标 签字 段 ) 在 1Pv4 数据 报 中 无 对 应 部 分 、， 这 些 字段 的 信息 将 会 丢失 。 因此， 即使 正和 F 
能 交换 IPv6 数据 报 ， 从 DD 到 达 正 的 IPv4 数据 报 并 不 含有 从 A 发 出 的 初始 IPv6 数据 报 中 的 
所 有 字段 。 








A 到 B: IPv6  B 到 C: IPv4 i 
图 4-25 一 种 双 栈 方法 


RFC 4213 中 还 讨论 了 男 一 种 双 栈 方法 ， 叫 做 建 隧道 (tunneling) 。 该 方法 能 解决 上 述 
问题 ， 允 许 如 接收 源 于 A 的 IPv6 数据 报 。 隧道 依据 的 基本 思想 如 下 : 假定 两 个 IPv6 结 
点 《如 图 4-25 中 的 B 和 E) 要 使 用 IPv6 数据 报 进行 交互 ,但 它们 是 经 由 中 间 IPv4 路 由 天 
互联 的 。 我 们 将 两 台 IPv6 路 由 需 之 间 的 中 间 IPv4 路 由 希 的 集合 称 为 一 个 隧道 (tunnel), 
如 图 4-26 所 示 。 fA BNP be, FERRI AIK AY IPv6 结 点 (如 B) 可 将 整个 IPv6 数据 报 放 
到 一 个 IPv4 数据 报 的 数据 AKR) 字段 中 。 于 是 ， 该 IPv4 数据 报 的 地 址 设 为 指 问 隧 
道 接 收 问 的 IPv6 结 点 (如 EE)， 再 发 送 给 隧道 中 的 第 一 个 结 点 (如 C)。 隧 道中 的 中 间 
IPv4 路 申 咒 在 它们 之 间 为 该 数据 报 提供 路 由 ， 就 像 对 待 其 他 数据 报 一 样 ， 完 全 不 知道 该 
IPv4 数据 报 自 喘 就 含有 一 个 完整 的 IPv6 数据 报 。 隧 道 接 收 端的 IPv6 结 点 最 终 收 到 该 IPv4 
数据 报 〈 它 是 该 IPv4 数据 报 的 目的 地 !) ， 并 确定 该 IPv4 数据 报 含有 一 个 IPv6 数据 报 ， 于 
是 从 中 取出 IPv6 数据 报 ， 然 后 再 为 该 IPv6 数据 报 提供 路 由 ， 就 好 像 它 是 从 一 个 直接 相连 
的 IPv6 邻 届 那里 接收 到 该 IPv6 数据 的 一 样 。 

在 结束 本 节 前 需要 说 明 的 是 ， 尽 管 IPv6 的 采用 最 初 表现 为 一 个 缓慢 启动 的 过 程 
| Lawton 2001 ] ， 但 是 最 近 已 经 积蓄 了 力量 。 有 关 2008 年 IPv6 部 署 的 讨论 参见 | Huston 
2008b |; 有 关 美 国 IPv6 部 署 的 概况 参见 [NIST IPv6 2012 ] 。 大 量 增加 的 设备 如 IP 使 能 电 
话 与 其 他 便携 式 设备 为 IPv6 的 更 广泛 部 署 提供 了 额外 的 推动 力 。 欧 洲 的 第 三 代 合 作 计划 
[3GPP 2012} 已 规定 了 IPv6 为 移动 多 媒体 的 标准 编 址 方案 。 

我 们 能 从 IPv6 经 验 中 学 到 的 重要 一 读 是 ， 要 改变 网 络 层 协议 是 极其 困难 的 。 目 从 20 
世纪 90 年 代 早 期 以 来 ， 有 许多 新 的 网 络 层 协 议 被 鼓吹 为 因特网 的 下 一 次 重大 音 命 ， 但 这 
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些 协 以 中 的 大 多 数 至 今 为 止 只 取得 了 上 有限 突 破 。 这 些 协议 包括 IPv6 、 多 播 协 以 (4.7 市 )、 
资源 预 留 协议 (第 7 章 )。 ee | 入 新 的 协议 的 确 如 同 蔡 换 一 幢 房 子 的 基石 ， 妈 在 
NAR PE (或 至 少 临 时 重新 安置 房屋 住户 ) 的 情况 下 是 很 难 完 成 上 述 工 作 的 。 在 田 
一 方面 ， 因 特 网 却 已 见证 了 在 应 用 层 中 新 协议 的 快速 部 署 。 典 型 的 例子 当然 有 Web、 即 时 
HWE. P2P 文件 共享 。 其 他 例子 包括 音频 与 视频 流 和 分 布 式 游戏 。5 引 入 新 的 应 用 层 协议 就 
像 给 一 峡 房 子 重新 刷 一 层 漆 ， 这 是 相对 容易 做 的 事 ， 如 果 你 选择 了 一 个 好 看 的 颜色 ， 
将 会 照搬 你 的 选择 。 总 之 ,我们 在 未 来 能 够 期 竺 看 到 因特网 网 络 层 中 的 这 些 变 化 ， 但 这 
变化 出 现 的 时 间 尺 度 很 可 能 要 比 在 应 用 层 中 出 现 的 变化 要 慢 得 多 。 
逻辑 视图 








Do 


EAE: Pv 






E: 


RSI: Trd DËIJE: IPv4 
(封装 IPv6) (封装 IPv6 ) 


图 4-26 PAK 
4.4.5 涉足 IP 安全 性 


4.4.3 节 详 细 讨 论 了 IPv4 ,包括 它 提供 的 服务 以 及 如 何 实现 这 些 服务 的 方法 。 在 阅读 

该 节 内 容 的 时 候 ， 你 可 能 注意 到 了 并 没有 提 到 任何 安全 服务 。IPv4 的 设计 的 确 是 在 因特网 

主要 用 于 相互 信任 的 联网 研究 人 员 之 间 的 时 代 (20 世纪 70 年 代 )。 创 建 一 个 能 够 集成 多 
种 链 路 层 技术 的 计 算 机 网 络 已 经 面临 了 足够 多 的 挑战 了 ， 无 法 顾及 安全 性 了 。 

但 是 ， 在 安全 性 成 了 主要 关注 对 象 的 今天 ， 因 特 网 研究 人 5 i :了 ， 他 们 
设计 了 提供 各 种 安全 性 服务 的 新 型 网 络 层 协议 。 这 些 协 议 之 一 是 IPsec， 这 是 一 种 非常 流 
行 的 安全 网 络 层 协议 ， 也 在 虚拟 专用 网 (VPN) 中 得 到 了 广泛 部 署 。 尽 管 在 第 8 章 中 我 们 
将 更 为 详细 地 讨论 IPsec 及 其 密码 学 基础 ， 但 在 本 市 中 我 们 只 对 IPsec 服务 提供 一 个 简要 
的 、 高 层 的 概述 。 

IPsec 已 被 设计 为 与 IPv4 和 IPv6 向 后 兼容 。 特 别 是 ， 为 了 享受 IPsec 带 来 的 好 处 ， 我 
们 不 需要 替换 因特网 中 的 所 有 路 由 器 和 主机 中 的 协议 栈 。 例 如 ， 使 用 运输 模式 (两 种 
IPsec“ 模 式 ” 之 一 ) 时 ， 如 果 两 台 主 机 要 安全 地 通信 ，lPsee 仅 需 要 在 这 两 台 主 机 中 可 
用 。 所 有 其 他 路 由 需 和 主机 能 够 继续 运行 普通 的 了 Pv4。 
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为 了 具体 起 见 ， 我 们 这 里 将 关注 IPsec 的 运输 模式 。 使 用 这 种 模式 ， 两 台 主 机 首先 在 
它们 之 间 创 建 一 个 IPsece 会 话 。( 因此 IPsec 是 面向 连接 的 !) 使 用 适当 的 会 话 ， 在 这 两 台 
主机 之 间 发 送 的 所 有 TCP 和 UDP 报 文 段 都 享受 IPsec 提供 的 安全 性 服务 。 在 发 送 病 ， 运 输 
层 问 IPsec 传递 一 个 报 文 段 。IPsec 然后 加 蜜 该 报 文 段 ， 在 报 文 段 上 添加 附加 的 安全 性 字 
段 ， 并 旦 在 一 个 普通 的 IP 数据 报 中 封装 得 到 的 有 效 载 集 。 (实际 中 比 上 述 过 程 要 复杂 一 
点 ,我们 将 在 第 8 EHE.) 发 送 主 机 接 下 来 加 因特网 中 发 送 数 据 报 ， 因 特 网 则 将 数 
据 报 传送 到 日 的 主机 ,在 那里 ，IPsec 解密 报 文 段 并 将 脱 密 的 报 文 段 传送 给 运输 层 。 
由 IPsec 会 话 提 供 的 服务 包括 : 
e 密码 技术 约定 。 这 种 机 制 允许 两 台 通 信 的 主机 对 加 密 算 法 和 密 钥 达成 一 致 。 
© IP 数据 报 有 效 载荷 的 加 客 。 当 发 送 主机 从 运输 层 接 收 到 一 个 报 文 段 时 ，IPsec 加 密 
该 有 效 载荷 。 该 有 效 载 荷 仅 能 由 在 接收 主机 中 的 IPsec 解密 。 

e 数据 完整 性 。IPsec 允许 接收 主机 验证 数据 报 的 首部 字段 ， 保 证 被 加 密 的 有 效 载 何 
在 其 数据 报 从 源 到 目的 地 的 路 由 带 中 传输 时 没有 被 修改 过 。 

e 初始 鉴别 。 当 一 台 主 机 从 某 受信 任 的 源 (具有 一 个 受信 任 的 密 钥 ,参见 第 8 章 ) 
接收 到 一 个 IPsec 数据 报时 ， 该 主机 确信 在 数据 报 中 的 源 IP 地 址 是 该 数据 报 的 实 
PRI 

当 两 台 主 机 在 它们 之 间 创 建 了 一 个 IPsec 会 话 时 ， 在 它们 之 间 发 送 的 所 有 TCP 和 UDP 
报 文 段 将 被 加 密 和 鉴别 。IPsec 因此 提供 了 地 和 株式 给 盖 ， 使 这 两 台 主 机 之 间 的 所 有 网 络 应 
用 进行 安全 通信 。 

通过 使 用 IPsec， 一 个 公司 能 够 在 非 安 全 的 公共 因特网 中 进行 安全 通信 。 为 了 进行 说 
H, 我们 这 里 只 看 一 个 简单 的 例子 。 考 虑 一 个 拥有 大 批 销售 人 员 的 公司 ， 这 些 销 售 人 员 分 
布 在 各 地 跑 业 务 。 假 定 各 种 销售 人 员 需 要 经 常 查询 公司 的 敏感 信息 (例如 价格 和 产品 信 
息 ) ， 这 些 信 息 存储 在 公司 总 部 的 一 台 服 务 嚣 上。 进一步 假 设 销售 人 员 也 需要 彼此 发 送 敏 
感 文 档 。 使 用 IPsec 怎样 能 够 做 到 这 一 点 呢 ? 如 你 猜想 的 那样 ， 我 们 在 这 侣 服 务 闫 和 所 有 
销售 人 员 的 便携 机 上 安装 IPsec。 借 助 于 安装 在 这 些 主 机 上 的 IPsec， 某 销售 人 员 无 论 何 时 
需要 与 服务 器 通信 或 与 男 一 名 销售 人 员 通 信 ， 这 些 通信 会 话 将 是 安全 的 。 


4.5 路 由 选择 算法 


到 目前 为 止 ， 我 们 在 本 章 中 主要 研究 了 网 络 层 的 转发 功能 。 我 们 知道 当 分 组 到 达 一 合 
路 由 器 时 ， 该 路 由 需 索 引 其 转发 表 并 决定 该 分 组 被 指 回 的 链 路 接口 。 我 们 也 知道 路 由 选择 
算法 在 网 络 路 由 器 中 运行 、 交 换 和 计算 信息 ， 用 这 些 信 息 配 置 这 些 转发 表 。 路 由 选择 算法 
和 转发 表 之 间 的 相互 影响 如 图 4-2 所 示 。 在 已 经 较为 深入 地 人 研究 了 转发 后 ， 我 们 将 注意 力 
转向 本 章 的 其 他 重要 主题 ， 即 网 络 层 的 至 关 重 要 的 路 由 选择 功能 。 不 管 网 络 层 提供 的 是 数 
据 报 服务 (在 此 情况 下 ， 在 给 定 源 和 目的 地 址 之 间 的 不 同 分 组 可 能 采用 不 同 的 路 由 ) ， 还 
是 虚 电路 服务 (在 此 情况 下 ， 在 给 定 源 和 目的 地 址 之 间 的 所 有 分 组 将 采用 相同 路 径 )， 网 
络 层 都 必须 为 从 发 送 方 到 接收 方 的 分 组 确定 所 采用 的 路 径 。 我 们 将 看 到 路 由 选择 的 工作 
是 : 确定 从 发 送 方 到 接收 方 通过 路 由 屁 网 络 的 好 路 人 径 (等 价 为 路 由 )。 

主机 通常 直接 与 一 台 路 由 需 相 连接 ， 该 路 由 需 即 为 该 主机 的 默认 路 由 普 (default router), 
又 称 为 该 主机 的 第 一 跳 路 由 器 (first-hop router)。 每 当主 机 发 送 一 个 分 组 时 ， 该 分 组 被 传 
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KAA E YAR aa FR EL RS fe EB Be (source router) ， 把 目的 
EELIS ER H ak Oe A AA A Be (destination router), 一 个 分 组 从 源 主 机 到 目的 主机 的 
路 由 选择 问题 显然 可 归结 为 从 源 路 由 器 到 目的 路 由 需 的 路 巾 选 择 问题 . 这 是 本 的 重点 。 

因此 ， 路 由 选择 算法 的 目的 是 简单 的 : 给 定 一 组 路 由 融 以 及 连接 路 由 硕 的 链 路 ， 路 由 
选择 算法 要 找到 一 条 从 源 路 由 需 到 目的 路 由 硕 的 “好 ”路 径 . 通常 ， 一 条 好 路 径 指 具有 节 
低 费 用 的 路 径 。 然 而 我 们 将 看 到 ， 实 践 中 现实 世界 还 关心 诸如 策略 之 类 的 问题 〈 例 如 ， 诺 
如 “属于 组 织 Y 的 路 由 右 XX 不 应 转发 任何 来 源 于 组 织 Z 网 络 的 分 组 ”之 类 的 规则 ) ， 这 也 
使 得 概念 简单 、 性 能 优秀 的 算法 变 得 复杂 .然而 这 些 概 念 简单 、 性 能 优秀 的 算法 的 理论 真 
定 了 当今 网 络 路 由 选择 实践 的 基础 。 

可 以 用 图 来 形式 化 描述 路 由 选择 问题 。 我 们 
知道 图 (graph) G=(N, E) 是 一 个 NN 个 结 点 和 
E 条 边 的 集合 ， 其 中 每 条 边 是 取 目 N 的 一 对 结 
点 。 在 网 络 层 路 由 选择 的 环境 中 ， 图 中 的 结 点 表 
示 路 由 器 ， 这 是 做 出 分 组 转发 决定 的 点 ; 连接 这 
些 结 点 的 边 表示 这 些 路 由 器 之 间 的 物理 链 路 。 这 
样 一 个 计算 机 网 络 图 的 抽象 显示 在 图 4-27 中 而 
要 查看 某 些 表示 实际 网 络 图 的 图 ,参见 | Dodge 
2012; Cheswick 2000]; 对 于 基于 不 同 的 图 模型 
建 模 因 特 网 的 好 坏 的 讨论 ， 参 见 [Zegura 1997, KAT 一 个 计算 机 网 络 的 抽象 图 模型 
Faloutsos 1999; Li 2004 |., 

如 图 4-27 所 示 ， 一 条 边 还 有 一 个 值 表示 它 的 费用 。 通常， 一 条 边 的 费用 可 反映 出 对 
应 链 路 的 物理 长 度 〈 例 如 一 条 越 洋 链 路 的 费用 可 能 比 一 条 短途 陆地 链 路 的 费用 高 ) 、 链 路 
速度 ， 或 与 该 链 路 相关 的 金融 上 的 费用 。 为 了 我 们 的 目的 ,我 们 只 将 这 些 链 路 费用 看 成 是 
给 定 的 ， 而 不 必 操 心 这 些 值 是 如 何 确定 的 。 对 于 五 中 的 任 一 条 边 (x, y), 我 们 用 (x, y) 
表示 结 点 x Ally 间 边 的 费用 。 如 果 不 属于 的 结 点 对 (x, Y)， 置 c(x, y) =o, WEI, 我 
们 考虑 都 是 无 向 图 ( 即 图 的 边 没 有 方向 ) ， 因 此 边 (x, y) S (y, x) 是 相同 的 并 且 
c(x, y) =c(y, x). WR (x, y) AFE, H y REKRAI A x 的 邻居 (neighbor), 

在 图 抽象 中 为 各 条 边 指派 了 费用 后 ， 路 由 选择 算法 的 日 然 目 标 是 找 出 从 源 到 目的 地 间 
的 最 低 费 用 路 径 。 为 了 使 问题 更 为 精确 ， 回 想 在 图 G =(N, E) 中 的 一 条 路 径 (pah) 是 
dl EN i Bly eo CBee Ml 
E E PAW. PRE (x, me, a) 的 费用 只 是 沿 着 路 径 所 有 边 的 费用 的 总 和 ， 即 
C(%,, X3) te(x,, xy) +e telax, zi)。 给 定 任何 两 个 结 点 xx 和 y， 通 常 在 这 两 个 结 点 之 
间 有 许多 条 路 径 ， 每 条 路 径 都 有 一 个 费用 。 这 些 路 径 中 的 一 条 或 多 条 是 最 低 费 用 路 径 
(least-cost path) 。 因 此 最 低 费 用 路 径 问 题 是 清楚 的 : 找 出 源 和 目的 地 之 间 的 具有 最 低 费 用 
的 一 条 路 。 例 如 ， 在 网 4-27 中 ， 源 结 点 u 和 目的 结 点 w 之 间 的 最 低 费 用 路 径 是 Cu, x, 
y，Ww) ， 具 有 的 路 径 费 用 是 3. 注意 到 若 在 图 中 的 所 有 边 具 有 相同 的 费用 , 则 最 低 费 用 路 
径 也 就 是 最 短路 径 (shortest path) ， 即 在 源 和 目的 地 之 间 的 具有 最 少 链 路 数量 的 路 径 . 

作为 一 个 简单 练习 ， 试 找 出 图 4-27 中 从 结 点 & 到 结 点 z 的 最 低 费 用 路 人 径 ， 并 要 反映 出 
你 是 如 何 算出 该 路 径 的 。 如 果 你 像 大 多 数 人 一 样 ， 通 过 考察 图 4-27， 跟 踊 几 条 从 4 到 2z 的 
路 由 ， 你 就 能 找 出 从 到 zz 的 路 径 ， 然 后 以 某 种 方式 来 确信 你 所 选择 的 路 径 就 是 所 有 可 能 
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的 足 径 中 具有 最 低 费 用 的 路 径 。( 你 考察 过 4 Bz ZA A 17 ART EN ER ENS? (RAY hE 
RED 这 种 计算 就 是 一 种 集中 式 路 由 选择 算法 的 例子 ， 即 路 由 选择 算法 在 一 个 位 置 ( 即 
你 的 大 脑 中 ) 运行 ， 有 具有 该 网 络 的 完整 信息 。 对 路 由 选择 算法 的 一 种 广义 分 类 方式 是 根据 
沪 算 法 是 全 局 式 的 还 是 分 散 式 的 来 加 以 区 分 。 
e 全 局 式 路 由 选择 算法 (global routing algorithm) 用 完整 的 、 全 局 性 的 网 络 知 识 计 算 
出 从 源 到 目的 地 之 间 的 最 低 费 用 路 人 径 。 也 就 是 说 ， 该 算法 以 所 有 结 点 之 间 的 连通 
性 及 所 有 链 路 的 费用 为 输入 。 这 整 要 求 该 算法 在 真正 开始 计算 以 前 ， 要 以 某 种 方 
陈 获 得 这 些 信息 。 计 算 本 身 可 在 东 个 场 点 (集中 式 全 局 路 由 选择 算法 ) 进行 ,或 
可 在 多 个 场 点 重复 进行 。 然 而 这 里 的 主要 区 别 在 于 ， 全 局 式 算 法 具有 关于 连通 性 
和 链 路 费用 方面 的 完整 信息 。 实 践 中 ， 具 有 全 局 状态 信息 的 算法 笛 被 称 作 链 路 状 
态 (Link State, LS) 算法 ， 因 为 该 算法 必须 知道 网 络 中 每 条 链 路 的 费用 ,我 们 将 
在 4.5. 1 节 中 学 习 LS 算法 。 
© 分 散 式 路 由 选择 算法 (decentralized routing algorithm) 以 从 代 、 分 布 式 的 方式 计算 


出 最 低 费 用 路 径 。 没 有 结 点 拥有 关于 所 有 网 络 链 路 费用 的 完整 信息 ， 而 每 个 结 点 
仅 有 与 其 直接 相连 链 路 的 费用 知识 即 可 开始 工作 。 然 后 ， 通 过 迭代 计算 过 程 并 与 
相 邻 结 点 〈 即 与 该 结 点 相连 链 路 的 另 一 端的 结 点 ) 交换 信息 ， 一 个 结 点 逐渐 计算 
出 到 达 某 目的 结 点 或 一 组 目的 结 点 的 最 低 费 用 路 径 。 我 们 将 在 后 面 的 4. 5.2 节 学 


习 一 个 称 为 距离 向 量 (Distance- Vector, DV) 算法 的 分 散 式 路 由 选择 算法 .之 所 
以 叫做 DV 算法 ， 是 因为 每 个 结 点 维护 到 网 络 中 所 有 其 他 结 点 的 费用 (距离 ) 佑 
计 的 回 量 . 
路 由 选择 算法 的 第 二 种 广义 分 类 方式 是 根据 算法 是 静态 的 还 是 动态 的 进行 分 类 .在 静 
态 路 由 选择 算法 (static routing algorithm) 中 ， 随 春 时 间 的 流逝 ， 路 由 的 变化 是 非常 缓慢 
的 ， 通 党 是 人 工 干预 进行 调整 ( 如 人 为 手工 编辑 一 人 台 路 由 带 的 转发 表 ) 。 动态 路 由 选择 算 
法 (dynamic routing algorithm) 能 够 当 网 络 流量 人 负载 或 拓扑 发 生变 化 时 改变 路 由 选择 路 答 
一 个 动态 算法 可 周期 性 地 运行 或 直接 响应 拓扑 或 链 路 费用 的 变化 而 运行 。 昌 人 然 动态 算法 另 
于 对 网 络 的 变化 做 出 反应 ， 但 也 更 容易 受 诸如 路 由 选择 循环 、 路 由 振荡 之 类 问题 的 影响. 
路 由 选择 算法 的 第 三 种 分 类 方式 是 根据 它 是 负载 敏感 的 还 是 负载 迟钝 的 进行 划分 。 在 
负载 敏感 算法 (load-sensitive algorithm) 中 ， 链 路 费用 会 动态 地 变化 以 反 上 映 出 底层 链 路 的 
当前 拥塞 水 平 。 如 果 当 前 拥塞 的 一 条 链 路 与 高 费用 相 联 系 ， 则 路 由 选择 算法 趋 问 于 绕 开 该 
拥塞 链 路 来 选择 路 由 。 而 早期 的 ARPAnet 路 由 选择 算法 就 是 负载 敏感 的 | McQuillan 
1980 | ， 所 以 遇 到 了 许多 难题 | Huitema 1998 |, 当今 的 因特网 路 由 选择 算法 (如 RIP, 
OSPF 和 BGP) 都 是 负载 迟钝 的 (1oad-insensitive ) ， 因 为 革 条 链 路 的 费用 不 明显 地 反映 其 当 
前 (或 最 近 ) 的 拥塞 水 平 。 


4.5.1 链 路 状态 路 由 选择 算法 


前 面 讲 过 ， 在 链 路 状态 算法 中 ， 网 络 拓扑 和 所 有 的 链 路 费用 都 是 已 知 的 ， 也 就 是 说 可 
用 作 LS 算法 的 输入 。 实 践 中 这 是 通过 让 每 个 结 点 回 网 络 中 所 有 其 他 结 点 广播 链 路 状态 分 
组 来 完成 的 ， 其 中 每 个 链 路 状态 分 组 包含 它 所 连接 的 链 路 的 特征 和 费用 : 在 实践 中 〈 例 如 
使 用 因特网 的 OSPF 路 由 选择 协议 ， 讨 论 见 4.6.1 节 )， 这 经 第 由 链 路 状态 广播 (link state 
broadcast) 算法 | Perlman 1999] 来 完成 。 我 们 将 在 4.7 节 中 讨论 广播 算法 。 结 点 广播 的 


结果 是 及 有 结 点 具有 了 该 网 络 的 等 同 的 、 完 整 的 视图 。 于 是 每 个 结 点 都 能够 像 其 他 结 点 一 
样 ， 运 行 LS 算法 并 计算 出 相同 的 最 低 费 用 路 径 集合 。 

我 们 下 面 给 出 的 链 路 状态 路 由 选择 算法 叫做 Dijkstra 算法 ， 该 算法 以 其 发 明 者 命名 。 
一 个 密切 相关 的 算法 是 Prim 算法 ， 有 关 图 算法 的 一 般 性 讨论 参见 [ Cormen 2001] Dijk- 


stra 算法 计算 从 某 结 点 ( 源 结 点 ， 我 们 称 之 为 u) 到 网 络 中 所 有 其 他 绪 点 的 最 低 费 用 路 径 。 
Dijkstra 算法 是 迭代 算法 ， 其 性 质 是 经 算法 的 第 上 次 迭 代 后 ， 可 知 这 到 上 个 目的 结 点 的 最 低 
费用 路 径 ， 在 到 所 有 目的 结 点 的 最 低 费 用 路 径 之 中 ， 这 皮条 路 径 具 有 上 个 最 低 费 用 。 我 们 
定义 下 列 记号 。 


。 DO): 到 算法 的 本 次 迄 代 ， 从 源 结 点 到 目的 结 点 ,的 最 低 费 用 路 径 的 费用 ， 
© plo): 从 源 到 " 沿 着 当前 最 低 费 用 路 径 的 前 一 结 点 〈* 的 邻居 ) 。 
ON, 结 点 子 集 ; 如 果 从 源 到 ， 的 最 低 费用 路 径 已 确 知 ,，" ENP, 
该 全 局 路 由 选择 算法 由 一 个 初始 化 步骤 和 其 后 的 循环 组 成 。 循 环 执行 的 次 数 与 网 络 中 


结 点 个 数 相 同 。 一 旦 终止 ， 该 算法 就 计算 出 了 从 源 结 点 4 到 网 络 中 每 个 其 他 结 点 的 最 短 
路 径 。 

源 结 点 4 的 链 路 状态 (LS) 算法 

1 Initialization: 

2 N’ = {u} 

3 for all nodes v 

4 if v is a neighbor of u 

5 then D(v) = c(u,v) 

6 else D(v) = co 

J 

8 Loop 

9 find w not in N’ such that D(w) is a minimum 

10 add w to N’ 

11 update D(v) for each neighbor v of w and not in N’: 

w2 D(v) = min( D(v), D(w) + c(w,v) ) 

13 /* new cost to v is either old cost to v or known 

14 least path cost to w plus cost from w to v */ 


15 until N’= N 
举 一 个 例子 ， 考 虑 图 4-27 中 的 网 络 ， 计算 从 4 到 所 有 可 能 目的 地 的 最 低 费 用 路 径 。 
该 算法 的 计算 过 程 以 表格 方式 总 结 于 表 4-3 中 ， 表 中 的 每 一 行 给 出 了 和 迭代 结束 时 该 算法 的 
变量 的 伍 。 我 们 话 细 地 考虑 前 几 个 步 又 。 
表 4-3 在 图 4-27 中 的 网 络 上 运行 的 链 路 状态 算法 


步骤 N' D( v), piv) D(w), p(w) D(x), p(x) D( y), p(y) D(z), p(z) 
0 u 2, u 5, u la t 00 
l ux 2, u 4, x 2, x 
2 UXY 2o- ü Ja ¥ 4, 4 
3 Lx 3. 4 4, 3 
4 UX VVW 4,3 
5 UXYVWZ 


o 在 初始 化 步骤 ， 从 wu HHR AIHER ov, x, w 的 当前 已 知 最 低 费 用 路 径 分 
别 初始 化 为 2、1 和 5。 特 别 值得 注意 的 是 ， 到 w 的 费用 被 设 为 S (尽管 我 们 很 快 
就 会 看 见 一 条 费用 更 小 的 路 径 确实 存在 ) ， 因 为 这 是 从 到 w 的 直接 (一 跳 ) 链 
Re. Ely 与 z 的 费用 被 设 为 无 穷 大 ， 因 为 它们 不 直接 与 u 连接 。 
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© 在 第 一 次 迭代 中 ， 我 们 观察 那些 还 未 加 到 集合 N' 中 的 结 点 ， IF AR ET ARE 
代 结 束 时 有 具有 最 低 费 用 的 结 点 。 那 个 结 点 便 是 x， 其 费用 是 1， 因此 x 被 加 到 集合 
N' 中 。 于 是 LS 算法 中 的 第 12 行 中 的 程序 被 执行 ， 以 更 新 所 有 结 点 的 D(v)， 产 
生 表 4-3 中 第 2 行 〈 步 又 1) 所 示 的 结果 。 到 ”的 路 径 费 用 未 变 。 经 过 结 点 xx 到 ww 
(在 初始 化 结束 时 其 费用 为 5) 的 路 径 费 用 被 发 现 为 4。 因 此 这 条 具有 更 低 费 用 的 
路 径 被 选中 ， 且 沿 从 开始 的 最 短路 径 上 zw" 的 前 一 结 点 被 设 为 xz。 类 似 地 ， 到 7 
(经 过 x) 的 费用 被 计算 为 2， 且 该 表 也 被 相应 地 更 新 。 

o 在 第 二 次 迭代 时 ， 结 点 2 与 y 被 发 现 具有 最 低 费 用 路 径 (2) ， 并 且 我 们 任意 改变 
次 序 将 y MEREN H, NPER u, x 和 Yy。 到 仍 不 在 W' 中 的 其 余 结 点 (B 
结 点 2、w 和 z) 的 费用 通过 LS 算法 中 的 第 12 行进 行 更 新 ,产生 如 表 4-3 中 第 3 


行 所 示 的 结果 。 
。 如 此 等 等 。 
当 LS 算法 终止 时 ， 对 于 每 个 结 点 ， 我 们 都 得 到 从 源 结 点 沿 着 它 的 最 低 费 用 路 径 的 前 
一 结 点 。 对 于 每 个 前 一 结 点 ， 我 们 又 有 它 的 前 一 结 点 ， 以 此 方式 我 们 可 以 构建 从 源 结 点 到 
所 有 目的 结 点 的 完整 路 径 。 通 过 对 每 个 目的 结 点 存放 从 u 到 目的 地 的 最 低 费 用 路 径 上 的 下 
一 跳 结 点 ， 在 一 个 结 点 ( 如 结 点 4) 中 的 转发 表 则 能 够 根据 此 信息 而 构建 。 图 4-28 显示 了 


对 于 图 4-27 中 的 网 络 产 生 的 最 低 费 用 路 径 和 中 的 转发 表 。 





图 4-28 对 于 结 点 4 的 最 低 费 用 路 径 和 转发 表 


该 算法 的 计算 复杂 性 是 什么 ” 即 给 定 nn 个 结 点 (不 算 源 结 点 ) ， 在 最 坏 情 况 下 要 经 过 
多 少 次 计算 ， 才 能 找到 从 源 结 点 到 所 有 目的 结 点 的 最 低 费 用 路 径 ? 在 第 一 次 迭代 中 ， 我 们 
需要 搜索 所 有 的 n 个 结 点 以 确定 出 结 点 w 一 一 w 不 在 N' 中 且 具 有 最 低 费 用 。 在 第 二 次 迭代 
时 ， 我 们 需要 检查 -1 个 结 点 以 确定 最 低 费 用 。 第 三 次 对 -2 个 结 点 迭代 ， 依 次 类 推 。 
总 之 ， 我 们 在 所 有 和 迭代 中 需要 搜寻 的 结 点 总 数 为 (az+1)X， 因 此 我 们 说 前 面 实现 的 链 路 
状态 算法 在 最 差 情 况 下 复杂 性 为 0(n*)。( 该 算法 的 一 种 更 复杂 的 实现 是 使 用 一 种 称 为 堆 
的 数据 结构 ， 能 用 对 数 时 间 而 不 是 线性 时 间 得 到 第 9 行 的 最 小 值 ， 因 此 减少 其 复杂 性 。) 

在 完成 LS 算法 的 讨论 之 前 ， 我 们 考虑 一 下 可 能 出 现 的 问题 。 图 4-29 显示 了 一 个 简单 
的 网 络 拓 扑 ， 图 中 的 链 路 费用 等 于 链 路 上 承载 的 负载 ， 例 如 反映 要 历经 的 时 延 。 在 该 例 
中 ,， 链 路 费用 是 非 对 称 的 ， 即 仅 当 在 链 路 (u,v) 两 个 方 回 所 承载 的 负载 相同 时 c(u, v) 
与 c(v, u) 才 相 等 。 在 该 例 中 ， 结 点 z 产生 发 往 w 的 一 个 单元 的 流量 ， 结 点 * 也 产生 发 往 
w 的 一 个 单元 的 流量 ， 并 且 结 点 y 也 产生 发 往 w 的 一 个 数量 为 e 的 流量 。 初 始 路 由 选择 情 
况 如 图 4-29a 所 示 ， 其 链 路 费用 对 应 于 承载 的 流量 。 

当 LS 算法 再 次 运行 时 ， 结 点 y 确定 (基于 图 4-29a 所 示 的 链 路 费用 ) 顺 时 针 到 w 的 
路 径 费用 为 1， 而 逆 时 针 到 w 的 路 径 费 用 (一 直 使 用 的 ) 是 1+e。 因 此 y 到 w 的 最 低 费 用 
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路 径 现 在 是 顺 时 针 的 。 seca x Wine ELE w 的 新 的 最 低 费 用 路 径 也 是 顺 时 针 的 ， 产 生 如 
图 4-29b 中 所 示 的 费用 。， 当 LS 算法 下 次 运行 时 ， 结 点 x、y 和 = 部 检测 到 一 条 至 w 的 逆 时 
EAE RHE, EMAN 量 引 导 到 逆 时 针 方向 的 路 由 上 。 下 次 LS 算法 运行 时 ， 
x, y 和 = 都 将 其 流量 引导 到 顺 时 针 方 回 的 路 由 上 





c) xz 检测 到 w 的 更 好 路 径 ， 逆 时 针 d) x, yz 检测 到 w 的 更 好 路 径 ， 顺 时 针 
图 4-29 拥塞 敏感 的 路 由 选择 的 振荡 


如 何 才能 防止 这 样 的 振荡 〈 它 不 只 是 出 现在 链 路 状态 算法 中 ， 而 且 也 可 能 出 现在 任何 
使 用 拥塞 或 基于 时 延 的 链 路 测度 的 算法 中 ) 。 一 种 解决 方案 可 能 强制 链 路 费用 不 依赖 于 所 
承载 的 流量 ,但 那 是 一 种 不 可 接受 的 解决 方案 ， 因 为 路 由 选择 的 日 标 之 一 就 是 要 避 开 高 度 
拥塞 (如 高 时 延 ) 的 链 路 。 男 一 种 解决 方案 就 是 确保 并 非 所 有 的 路 由 右前 同时 运行 LS 算 
法 。 这 似乎 是 一 个 更 合理 的 方案 ， 因 为 我 们 希望 即使 路 由 器 以 相同 周期 运行 LS 算法 ,在 
每 台 路 由 天 上 算法 执行 的 时 机 也 将 是 不 同 的 ， 有趣 的 是 ， 研 究 人 员 近 RE. GLB TALE R 
上 的 路 由 如 能 在 它们 之 间 进 行 日 同步 | Floyd Synchronization 1994 ] ， 这 就 是 说 ， 即 使 它们 
初始 时 以 同一 周期 但 在 不 同时 刻 执 行 算法 ,算法 执 行 时 机 最 终 会 在 路 由 幽 上 变 为 同步 并 保 
持 之 。 避 免 这 种 自 同 步 的 一 种 方法 是 ， 让 每 台 路 由 器 发 送 链 路 通告 的 时 间 随 机 化 。 

学 习 过 LS 算法 之 后 ， 我 们 接 下 来 考虑 目前 在 实践 中 使 用 的 其 他 重要 的 路 由 选择 算法 ， 
即 距离 向 量 路 由 选择 算法 . 


45.2 距离 向 量 路 由 选择 算法 
距离 向 量 ( Distance- Vector, DV) 算法 是 一 种 迭代 的 、 异 步 的 和 分 布 式 的 算法 ， 而 LS 
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算法 是 一 种 使 用 全 局 信息 的 算法 。 说 它 是 分 布 式 的 ， 是 因为 每 个 结 点 都 要 从 一 个 或 多 个 直 
接 相 连 邻 大 接收 某 些 信 息 ， 执 行 计算 ， 然 后 将 其 计算 结果 分 发 给 邻居 。 说 它 是 迭代 的 ， 是 
因为 此 过 程 一 直 要 持续 到 邻居 之 间 无 更 多 信息 要 交换 为 止 。( 有 趣 的 是 ， 此 算法 是 自我 终 
止 的 ， 即 没有 计算 应 该 停止 的 信号 ， 它 就 停止 了 ,) 说 它 是 异步 的 ， 是 因为 它 不 要 求 所 有 
结 点 相互 之 间 步 伐 一 致 地 操作 。 我 们 将 看 到 一 个 异步 的 、 迭 代 的 、 自 我 终止 的 、 分 布 式 的 
算法 比 一 个 集中 式 的 算法 要 有 趣 得 多 。 

在 我 们 给 出 DV 算法 之 前 ， 有 必要 讨论 一 下 存在 于 最 低 费 用 路 径 的 费用 之 间 的 一 种 重 
HER, Dd (O) 是 从 结 点 < 到 结 点 ; 的 最 低 费 用 路 径 的 费用 。 则 该 最 低 费 用 与 著名 的 
Bellman- Ford 方程 相关 ， 即 

d (y) = min,je(x,v) + d,(¥) | (4-1) 
方程 中 的 min, 是 对 于 x 的 所 有 邻居 的 。Bellman- Ford 方程 是 相当 直观 的 。 实 际 上 ， 从 x Fo i 
历 之 后 ， 如 果 我 们 接 下 来 取 从 v 到 y 的 最 低 费 用 路 径 ， 则 该 路 径 费 用 将 是 c(x*，2) +d,(y)， 因 
此 我 们 必须 通过 遍历 某 些 邻 大 vw 开始， 从 x* 到 y 的 最 低 费 用 是 对 所 有 邻 抽 v 的 c(x, v) +d, (y) 
的 最 小 值 。 

但 是 对 于 那些 可 能 怀疑 该 方程 正确 性 的 人 ， 我 们 核查 在 图 4-27 中 的 源 结 点 w 和 目的 
结 点 2。 源 结 点 4 A 3 PB: 结 点 v、x Ale, WMA PINK AR, ADA 
d,(z) =5、 d,(z) =3 All d, (z) =3, 将 这 些 值 连同 费用 | 
代入 方程 (4-1), 得 出 d,(z) =min|2+5, 5+3,，1 +31 =4， 这 显然 是 正确 的 ， 并 且 对 同 
一 个 网 络 来 说 ， 这 正 是 Dijskstra 算法 为 我 们 提供 的 结果 .这 种 快速 验证 应 当 有 助 于 消除 你 
可 能 具有 的 任何 怀疑 。 

Bellman- Ford 方程 不 止 是 一 种 智力 上 的 珍品 ， 它 实际 上 有 具有 重大 的 实践 重要 性 ， 特 别 
是 对 Bellman- Ford 方程 的 解 为 结 点 x 的 转发 表 提 供 了 表 项 。 为 了 理解 这 一 点 ， 令 ”是 取得 

} 


方程 (4-1) 中 最 小 值 的 任何 相 邻 结 点 。 接 下 来 ， 如 果 结 点 x 要 沿 着 最 低 费 用 路 径 癌 结 点 y 
发 送 一 个 分 组 ， 它 应 当前 先 同 结 点 wv 转发 该 分 组 。 因 此 ， 结 点 x 的 转发 表 将 指定 结 点 vw 


作为 最 终 目 的 地 y EY BRE A ah. Bellman- Ford 方程 的 男 一 个 重要 实际 页 献 是 它 提 出 了 
将 在 DV 算法 中 发 生 的 邻居 到 邻居 通信 的 形式 ， 

其 基本 思想 如 下 。 每 个 结 点 x 以 D,(y) 开始 ， 对 在 NN 中 的 所 有 结 点 ,估计 从 它 自 己 
到 结 点 y 的 最 低 费 用 路 径 的 费用 , 令 D, =[D,(y): ye N] 是 结 点 x 的 距离 向 量 ， 该 向 量 
是 从 x 到 在 NN 中 的 所 有 其 他 结 点 y 的 费用 估计 的 向 量 。 使 用 DV 算法 ， 每 个 结 点 x 维护 下 

© 对 于 每 个 邻 大 vz， 从 x 到 直接 相连 邻居 vw 的 费用 为 c(x,， v). 

e 结 点 x 的 距离 器 量 , 即 D,=[D,(y): yeN], 包含 Tx 到 N 中 所 有 目的 地 y 的 费 

用 的 估计 值 。 

© 它 的 每 个 邻居 的 距离 向 量 ， 即 对 x 的 每 个 邻居 w,， 有 D,=[D,(y): yeN]. 

在 该 分 布 式 、 异 步 算 法 中 ， 每 个 结 点 不 时 地 向 它 的 每 个 邻居 发 送 它 的 距离 向 量 副本 ， 
当 结 点 x 从 它 的 任何 一 个 邻居 ”接收 到 一 个 新 距离 回 量 ， 它 保存 "的 距离 回 量 ， 然 后 使 用 
Bellman- Ford 方程 更 新 它 自己 的 距离 同 量 如 下 : 

D,(y) = min,ic(x,v) +D, y)! 对 入 中 的 每 个 结 点 

如 果 结 点 x 的 距离 问 量 因 这 个 更 新 步骤 而 改变 ， 结 点 x 接 下 来 将 问 它 的 每 个 邻居 发 送 

其 更 新 后 的 距离 回 量 。 令 人 惊奇 的 是 ,只 要 所 有 的 结 点 继续 以 异步 方式 交换 它们 的 距离 向 
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量 ， 每 个 费用 估计 D, O) KAS dy), dO) 为 从 结 点 x 到 结 点 y 的 实际 最 低 费 用 路 径 
的 费用 [ Bersekas 1991 | ! 
距离 向 量 (DV) 算法 


1 Initialization: 

2 for all destinations y in N: 

3 D (y) = ¢(x,y) /* if y is not a neighbor then c(x,y) = œ */ 
4 for each neighbor w 

5 Di(dy) = ? for all destinations y in N 

6 for each neighbor w 

7 send distance vector D, = [D (y): y in N] tow 

8 

9 loop 

10 wait (until I see a link cost change to some neighbor w or 

rl until I receive a distance vector from some neighbor w) 
12 

13 for each y in N: 

14 D (y) = min,{c(x,v) + D.(Y))} 

15 

16 if D (y) changed for any destination y 

17 send distance vector D, = [D (y): y in N] to all neighbors 
18 

19 forever 


在 该 DV 算法 中 ， 当 结 点 x 发现 它 的 直接 相连 的 链 路 费用 变化 或 从 某 个 邻居 接收 到 一 
个 距离 问 量 的 更 新 时 ， 它 就 更 新 其 距离 向 量 估计 , 但 是 为 了 一 个 给 定 的 目的 地 y 而 更 新 它 
的 转发 表 ， 结 点 x 真正 需要 知道 的 不 是 到 y 的 最 短路 径 距 离 ， 而 是 沿 着 最 短路 径 到 7 的 下 
一 跳 路 由 此 邻居 结 和 点 v"(y) 。 如 你 可 能 期 望 的 那样 ， 下 一 跳 路 由 天 ww (y) 是 在 DV 算法 第 
14 行 中 取得 最 小 的 邻 届 vo (如 果 有 多 个 取得 最 小 的 邻 眉 wz， 则 > Cy) 能 够 是 其 中 任何 一 
个 最 小 的 邻 大 -) 因此 ， 对 于 每 个 目的 地 y， 在 第 13 ~ 14 行 中 ， 结 点 上 也 决定 Cy) 并 更 
新 它 对 目的 地 y 的 转发 表 。 

前 面 讲 过 LS 算法 是 一 种 全 局 算法 ， 在 于 它 要 求 每 个 结 点 在 运行 Dijkstra 算法 之 前 ， 首 先 
获得 该 网 络 的 完整 信息 。DV 算法 是 分 布 式 的 ， 它 不 使 用 这 样 的 全 局 信息 。 实 际 上 ， 结 点 具 
有 的 唯一 信息 是 它 到 直接 相连 邻居 的 链 路 费用 和 它 从 这 些 邻 居 接 收 到 的 信息 。 每 个 结 点 等 待 
来 自任 何 邻 居 的 更 新 (第 10~11 行 )， 当 接收 到 一 个 更 新 时 计算 它 的 新 距离 向 量 (第 14 行 ) 
并 同 它 的 邻居 分 布 其 新 距离 同 量 (第 16~17 行 )。 许 多 类 似 DV 的 算法 在 实践 中 被 用 于 多 种 
路 由 选择 协议 中 ,包括 因特网 的 RIP 和 BGP, ISO IDRP、Novell IPX 和 早期 的 ARPAnet。 

图 4-30 举例 说 明了 DV 算法 的 运行 ， 应 用 场合 是 该 图 项 部 有 三 个 结 点 的 简单 网 络 。 算 
法 操作 以 同步 的 方式 显示 出 来 ， 其 中 所 有 结 点 同时 从 其 邻 拓 接收 报 文 ， 计算 其 新 距离 问 
量 ， 如 果 距 离 癌 量 发生 了 变化 则 通知 其 邻居 。 学 习 完 这 个 例子 后 ， 你 应 认识 到 算法 以 异步 
方式 也 能 正确 运行 ， 异 步 方式 中 可 在 任意 时 刻 出 现 结 点 计算 与 更 新 的 产生 /接收 。 

该 图 最 左边 一 列 显 示 了 这 3 个 结 点 各 目的 初始 路 由 选择 表 (routing table), fila, fiz 
于 左上 和 角 的 表 是 结 点 x 的 初始 路 由 选择 表 。 在 一 张 特定 的 路 由 选择 表 中 ， 每 行 是 一 个 距离 
回 量 村 别 是 每 个 结 点 的 路 由 选择 表 包 括 了 它 的 距离 和 回 量 和 它 的 每 个 邻居 的 距离 问 量 。 因 
此 ， 在 结 点 x 的 初始 路 由 选择 表 中 的 第 一 行 是 D, =[D,(x), D,(y), D,(z)]=[0, 2, 7], 
在 该 表 的 第 二 和 第 三 行 是 最 近 分 别 从 结 点 y 和 z 收 到 的 距离 向 量 。 因 为 在 初始 化 时 结 点 x 
还 没有 从 结 点 Y 和 z 收 到 任何 东西 ， 所 以 第 二 行 和 第 三 行 表 项 中 被 初始 化 为 无 穷 大 . 





bo 
A 
be, 





初始 化 后 ， 每 个 结 点 回 它 的 两 个 邻居 发 送 其 距离 回 量 。 图 4-30 中 用 从 表 的 第 一 列 到 表 
的 第 二 列 的 箭头 说 明了 这 一 情况 。 例 如 ， 结 点 回 两 个 结 点 yY Al 2 发 送 了 它 的 距离 问 量 忆 , = 
在 接收 到 该 更 新 后 ， 每 个 结 点 重新 计算 它 上 月 己 的 距离 回 量 。 例 如 ， 结 点 zx 计算 


i ee he 
inh at 
D (y) =min}e(x,y) + D,(y¥) ,c(x,z) + D.(y)} = min}2 +0,7 +1} =2 
+ D(z) ,e(x,z) + D(z); = minj2 +1,7+0; =3 


D(z) =min|c(x,y) 

第 二 列 因 此 为 每 个 结 点 显示 了 结 点 的 新 距离 回 量 连 同 刚 从 它 的 邻 拓 接收 到 的 距离 回 

ar. EEE, ONZE Sw 到 结 点 z eH it D(z) 已 经 从 7 变 成 了 3。 还 应 注意 到 ， 

对 于 结 点 Xx， 结 点 7 ae DV 算法 的 第 14 行 中 取得 了 最 小 值 ; 因此 在 该 算法 的 这 个 阶段 ， 
Aa 


我 们 在 结 点 Y 得 到 了 (yy) =y 和 z (z 





图 4-30 距离 回 量 (DV) 算法 
在 结 点 重新 计算 它们 的 距离 回 量 之 后 ， 它 们 再 次 回 其 邻居 发 送 它 们 的 更 新 距离 回 量 
(UREN a 图 4-30 sa 表 第 三 列 的 箭头 说 明了 这 一 情况 。 
(ERMA a x 和 结 点 z 发送 了 更新 : HA y 的 距离 问 量 没 有 发 生变 化 ， 因 此 结 点 YY 没 
有 发 送 更 新 。 i 文 些 更 新 后 ， 本 它们 的 距离 回 量 并 更 新 它们 的 路 








H HE p 显示 在 第 三 列 中 
从 邻居 i EAER oie, E A A R EERI AL ad A SS PU A A He FY ine (ER Be H 
径 的 费用 已 经 变化 的 过 程 继续 下 去 ， 直 到 无 更 新 报 文 发 送 为 止 。 在 这 个 时 候 ， 因 为 无 更 新 
报 文 发 送 ， 将 不 会 出 现 进 一 步 的 路 申 选择 表 计 算 ， 该 算法 将 进入 静止 状态 ; 即 所 有 的 结 点 
将 执行 DV 算法 的 第 10 ~11 行 的 等 待 。 该 算法 停留 在 静止 状态 ， 直 到 一 条 链 路 费用 发 生 改 
变 ， 如 下 面 所 讨论 的 
mete) s BED Be TL SCS 1 HEA A BE 
当 一个 运行 DV pi 的 结 点 检测 到 从 它 自 己 到 邻居 的 链 路 费用 发 生变 化 时 (第 10 ~ 11 
行 ) ， 它 就 更 新 其 距离 回 量 (第 13 ~14 行 )， 并 且 如 果 最 低 费 用 路 径 的 费用 发 生 了 变化 ， 
器 邻居 通知 其 新 的 距离 问 量 (第 16~17 行 ): 图 4-31a 图 示 了 从 y 到 x 的 链 路 费用 从 4 变 
为 1 情况 .我 们 在 此 只 关注 y 与 z 到 目的 地 x 的 距离 表 中 的 有 关 表 项 。 该 DV 算法 导致 下 
列 事件 序列 的 出 现 : 
e Et HEZI, y 检测 到 链 路 费用 变化 (费用 从 4 变 为 1) ， 更 新 其 距离 问 量 ， 并 通知 
ee 因为 最 低 费 用 路 径 的 费用 已 改变 . 
e 在 4 WZ, z KAKA y aae aE s% 它 计 算出 到 x 的 新 最 低 费 
用 (从 费用 5 减 为 费用 2)， 它 回 其 邻居 发 送 了 它 的 新 距离 癌 量 。 
a 在 4 IZ, y 收 到 来 目 en y 的 最 低 费 用 未 变 ， 因 此 不 发 
送 任何 报 文 给 z。 该 算法 进入 静止 状态 ， 
a 对 于 该 DV 算法 只 需 两 次 迭代 就 到 达 了 静止 状态 。 TE x y 之 间 费 用 减少 的 好 
消 旦 通过 网 络 得 到 了 了 迅速 传播 . 





图 4-31 链 路 费用 改变 


我 们 现在 考虑 一 下 当 某 链 路 费用 增加 时 发 生 的 情况 。 假 设 x y 之 间 的 链 路 费用 从 4 
增加 到 60， 如 图 4-31b 所 示 。 
1 ) 在 链 路 费用 变化 之 前 ，D,(x) =4，D,(z) =1，D.(y) =1 和 D,(x) =5。 在 i 时刻， 
y 检测 到 链 路 费用 变化 (费用 从 4 变 为 60)。y 计算 其 到 x 的 新 的 最 低 费 用 路 径 的 费用 值 为 
D (x) = minic(y,x) + D(x),c(y,2) + D(X)} = minj60 +0,1 +5} =6 
当然 ， 从 网 络 全 局 的 视角 来 看 ， 我 们 能 够 看 出 经 过 z 的 这 个 新 费用 是 错误 的 。 但 结 点 
y 仅 有 的 信息 是 ; ÈE) x 的 直接 费用 是 60， 且 z 上 次 已 告诉 y，z 能 以 费用 5 到 x。 因 此 ， 
为 了 到 达 x，Yy 将 通过 z 路由， 完全 期 望 z 能 以 费用 5 BA x, Bt, 时 刻 ， 我 们 遇 到 路 由 
选择 环 路 (routing loop) ， 即 为 到 达 x，y 通过 z 路 由 ，z 又 通过 y 路 由 。 路 由 选择 环 路 就 像 
一 个 黑洞 ， 即 目的 地 为 x 的 分 组 在 时 刻 到 达 y 或 z 后 ， 将 在 这 两 个 结 点 之 间 不 停 地 (或 
直到 转发 表 发 生 改变 为 止 ) 来 回 反复 。 
2) 因为 结 点 7 已 算出 到 x 的 新 的 最 低 费 用 ， 它 在 4 时 刻 将 该 新 距离 问 量 通 知 z。 
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3) Et 后 某 个 时 间 ，z 收 到 y 的 新 距离 同 量 ， 它 指示 了 yy 到 x 的 新 最 低 费 用 是 6。z 
知道 它 能 以 费用 1 到 达 yY， 因 此 计算 出 到 x 的 新 最 低 费 用 D.(x) =min}50+0, 1+6} =7. 
KH z 到 x 的 最 低 费 用 已 增加 了 ,于 是 它 便 在 1, 时 刻 通 知 y 其 新 费用 。 

4) 以 类 似 方 式 ， 在 收 到 z 的 新 距离 回 量 后 ,y 决定 D,(x) =8 并 向 z 发 送 其 距离 癌 量 ， 
k FÆ z WE D. (x) =9 Jf y 发 送 其 距离 回 量 ， 等 等 。 

沪 过 程 将 要 继续 多 和 久 呢 ”你 应 认识 到 循环 将 持续 44 次 迭代 (在 与 之 间 交 换 报 
X), ， 即 直到 z 最 终 算出 它 经 由 y 的 路 径 费 用 大 于 50 为止 此 时 ，z 将 《最 终 ) 确定 它 到 x 
的 最 低 费 用 路 径 是 经 过 它 到 x 的 直接 连接 ,yy 将 经 由 z 路 由 选择 到 x 关于 链 路 费用 增加 的 
坏 消 息 的 确 传播 得 很 慢 ! 如 果 链 路 费用 c(y, x) 从 4 变 为 10 000 HRH e(z, x) 为 9999 
时 将 发 生 什 么 样 的 现象 呢 ? 由 于 这 种 情况 ， 我 们 所 见 的 问题 有 时 被 称 为 无 穷 计数 (count- 
to-infinity) 问题 ， 

2. 距离 向 量 算法 : 增加 毒性 逆转 

刚才 描述 的 特定 循环 的 场景 可 以 通过 使 用 一 种 称 为 毒性 北 转 (poisoned reverse) 的 技术 
而 加 以 避免 。 其 思想 较为 简单 : 如 果 z 通 过 y 路 由 选择 到 目的 地 *,， 则 z 将 通告 y, E (2) 
到 x% 的 距离 是 无 穷 大 ， 即 z 将 问 y 通告 D.(x) = wm (即使 实际 上 知道 已 (*) =5)。 只 要 = 经 
y 路 由 选择 到 x，; 就 持续 地 向 y 讲述 这 个 善意 的 谎言 。 因 为 y 相信 = 没有 到 x 的 路 径 ， 故 只 
要 z 继续 经 y 路 由 选择 到 x 〈 并 这 样 去 撒谎 ) ，y 将 永远 不 会 试 网 经 由 =z 路 由 选择 到 x. 

我 们 现在 看 一 下 毒性 逆转 如 何 解决 我 们 前 面 在 图 4-31b 中 遇 到 的 特定 环 路 问题 。 作为 
毒性 逆转 的 结果 ，Yy 的 距离 表 指 示 了 了 D.(x) =e. 4 (x, y) 链 路 的 费用 在 to 时刻 从 4 变 
为 60 时 ，y 更 新 其 表 ， 虽然 费用 高 达 60， 仍 继续 直接 路 由 选择 到 x， 并 将 到 x 的 新 费用 通 
Az, BID (x) =60, z Æi 时 刻 收 到 更 新 后 ， 便 立即 将 其 到 zx 的 路 由 切换 到 经 过 费用 为 50 
的 直接 (z, x) 链 路 。 因 为 这 是 一 条 新 的 到 x 的 最 低 费用 路 径 ， 且 因为 路 径 不 再 经 过 yY，z 
就 在 t 时 刻 通知 y 现在 D.(x) =50。 在 收 到 来 自 z 的 更 新 后 ，y HEA D,(x) =51 更 新 其 距 
离 表 。 男 外 ， 因 为 z 此 时 位 于 y 到 x 的 最 低 费 用 路 径 上 ， 所 以 y 通过 在 1; 时 刻 通 知 z 其 
D,(x) =o (即使 y 实 际 上 知道 D,(x) =51) 毒化 从 z 到 x 的 逆 回 路 径 。 

毒性 逆转 解决 了 一 般 性 的 无 穷 计 数 问题 吗 ? 没有 。 你 应 认识 到 涉及 3 个 或 更 多 结 扣 
(而 不 只 是 两 个 直接 相连 的 邻居 结 点 ) 的 环 路 将 无 法 用 毒性 逆转 技术 检测 到 。 

3. LS 与 DV 路 由 选择 算法 的 比较 

DV 和 LS 算法 采用 互补 的 方法 来 解决 路 由 选择 计算 问题 。 在 DV 算法 中 ， 每 个 结 点 仅 
与 它 的 直接 相连 的 邻居 交谈 ， 但 它 为 其 邻居 提供 了 从 它 自己 到 网 络 中 〈 它 所 知道 的 ) 所 有 
其 他 结 点 的 最 低 费 用 估计 。 在 LS 算法 中 ,每 个 结 点 〈 经 广播 ) 与 所 有 其 他 结 点 交谈 ， 但 
它 仅 告诉 它们 与 它 直 接 相 连 链 路 的 费用 。 我 们 通过 快速 比较 它们 各 目的 属性 来 总 绪 所 学 的 
fERMORA SIR HERA., IAEN 是 结 点 (路 由 器 ) WES, MEE (HR) 的 集合 。 

o 报 文 复杂 性 。 我们 已 经 看 到 LS 算法 要 求 每 个 结 点 都 知道 网 络 中 每 条 链 路 的 费用 。 

这 就 要 求 要 发 送 O(|N| IE) 个 报 文 。 而 且 无 论 何 时 一 条 链 路 的 费用 改变 时 ， 必 
须 向 所 有 结 点 发 送 新 的 链 路 费用 。DYV 算法 要 求 在 每 次 迭代 时 ， 在 两 个 直接 相连 邻 
居 之 间 交 换 报 文 。 我 们 已 经 看 到 ， 算 法 收敛 所 需 时 间 依 赖 于 许多 因素 。 当 链 路 费 
用 改变 时 ，DYV 算法 仅 当 在 新 的 链 路 费用 导致 与 该 链 路 相连 结 点 的 最 低 费 用 路 径 发 
生 改 变 时 ， 才 传播 已 改变 的 链 路 费用 。 
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e 收敛 速度 。 我 们 已 经 看 到 LS 算法 的 实现 是 一 个 要 求 0O(1N 11E|) 个 报 文 的 
OCUN | ) 算 法 。DYV 算法 收敛 较 慢 ， 且 在 收敛 时 会 遇 到 路 由 选择 环 路 。DYV 算法 还 
会 遭遇 无 穷 计数 的 问题 
o 健 闪 性 。 如果 一 台 路 申 需 发 生 故 障 、 行 为 错乱 或 受到 破坏 时 情况 会 怎样 呢 ? 对 于 LS 
算法 ， 路 由 器 能 够 向 其 连接 的 一 条 链 路 广播 不 正确 费用 (但 是 没有 其 他 链 路 ) 。 作 为 
LS 广播 的 一 部 分 ， 一 个 结 点 也 可 损坏 或 丢弃 它 收 到 的 任何 LS 广播 分 组 但 是 一 个 
LS 结 点 仅 计算 自己 的 转发 表 ; 其 他 结 点 也 目 行 执行 类 似 的 计算 。 这 束 意 味 厦 在 LS 
算法 下 ， 路 由 计算 在 某 种 程度 上 是 分 离 的 ， 提 供 了 一 定 程度 的 健壮 性 。 在 DV 算法 
F, 一 个 结 点 可 向 任意 或 所 有 目的 结 点 通告 其 不 正确 的 最 低 费 用 路 答 。( 在 1997 年 ， 
一 个 小 ISP 的 一 台 有 故障 的 路 由 带 的 确 癌 美国 的 主干 路 由 上 带 提 供 了 错误 的 路 由 选择 
信息 。 这 引起 了 其 他 路 由 带 将 大 量 流量 引 同 该 故障 路 由 右 ， 并 导致 因特网 的 大 部 分 
中 断 连接 达 数 小 时 [Neumann 1997 | ,) 更 一 般 地 ， 我 们 会 注意 到 每 次 迭代 时 ， 在 DV 
算法 中 一 个 结 点 的 计算 会 传递 给 它 的 邻 届 ， 然 后 在 下 次 欠 代 时 册 间 接地 传递 给 邻居 
的 邻居 。 在 此 情况 下 ，DYV 算法 中 一 个 不 正确 的 结 点 计算 值 会 扩散 到 整个 网 络 。 
总 之 ， 两 个 算法 没有 一 个 是 明显 的 最 家 ， 它 们 的 确 都 在 因特网 中 得 到 了 应 用 。 
4. 其 他 路 由 选择 算法 
我 们 已 学 过 的 LS 算法 与 DV 算法 不 仅 在 实践 中 得 到 了 广泛 使 用 ， 而 且 它 们 基本 上 是 
当前 因特网 实践 中 使 用 的 仅 有 的 两 种 路 由 选择 算法 。 无论 如 何 ， 在 过 去 的 30 年 里 ， 人 研究 
人 员 已 提出 了 许多 路 由 选择 算法 ， 从 非 委 简单 的 到 非常 精致 和 复杂 的 都 有 。 一 种 宽 沁 类 型 
的 路 由 选择 算法 是 基于 将 分 组 流量 看 作 是 网 络 中 源 和 目的 之 间 的 流 。 在 这 种 方法 中 ， 路 由 
选择 问题 可 在 数学 上 被 形式 化 为 一 个 称 之 为 网 络 流 问 题 的 受 限 优化 问题 | Bertsekas 1991 | . 
然而 ,我 们 在 此 要 提 及 的 男 外 一 类 算法 集合 ， 是 那些 来 源 于 电话 界 的 路 由 选择 算法 。 当 每 
条 链 路 资源 ( 如 缓冲 区 、 链 路 带宽 的 一 部 分 ) 需要 保留 给 每 条 经 过 该 链 路 的 连接 时 ， 这 些 
电路 交换 路 由 选择 算法 (circuit- switched routing algorithm) 对 分 组 交换 数据 网 是 很 有 价值 
的 。 里 然 该 路 由 选择 问题 的 形式 化 可 能 看 起 来 与 我 们 在 本 草 看 到 的 最 低 费 用 路 由 选择 的 形 
式 化 十 分 不 同 ， 但 也 有 许多 相似 性 ， 至 少 对 于 路 径 查 找 算 法 (路 由 选择 算法 ) 是 这 样 的 。 
关于 该 研究 领域 的 更 详细 的 讨论 ， 可 参考 | Ash 1998; Ross 1995; Girard 1990 ] . 


4.5.3 层次 路 由 选择 


在 LS 和 DV 算法 的 研究 中 ， 我 们 将 网 络 只 看 作 一 个 互联 路 由 需 的 集合 。 从 所 有 路 由 
器 执行 相同 的 路 由 选择 算法 以 计算 穿越 整个 网 络 的 路 由 选择 路 径 的 意义 上 来 说 , 一 台 路 由 
需 很 难 同 另 一 台 路 由 需 区 别 开 来 。 在 实践 中 ， 该 模型 和 这 种 一 组 执行 同样 路 由 选择 算法 的 
同 质 路 由 需 集 合 的 观点 有 一 点 简单 化 ， 因 为 至 少 有 以 下 两 个 重要 原因 : 
e 规模 。 随 着 路 由 需 数 目 变 得 很 大 ， 涉 及 路 由 选择 信息 的 计算 、 存 储 及 通信 【例如 LS 
更 新 或 最 低 费 用 路 径 的 变化 ) 的 开销 将 高 得 不 可 实现 。 当 今 的 公共 因特网 由 数 亿 台 
主机 组 成 。 在 这 些 主机 中 存储 的 路 由 选择 信息 显然 需要 巨大 容量 的 内 存 。 在 公共 因 
特 网 上 的 所 有 路 由 需 中 广播 LS 更 新 所 需 的 开销 将 导致 没有 剩余 的 审 宽 用 来 发 送 效 据 
分 组 ! 在 如 此 大 量 的 路 由 融 中 和 迭代 的 距离 向 量 算法 将 肯定 永远 无 法 收敛 ! 显然 ， 必 
须 采 取 一 些 措施 以 减少 公共 因特网 这 种 大 网 络 中 的 路 由 选择 计算 的 复杂 性 。 
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己 的 愿望 运行 和 管理 其 网 络 ， 还 要 能 将 其 网 络 与 其 他 外 部 网 络 相 连接 。 

这 两 个 问题 都 可 以 通过 将 路 由 需 组 织 进 自治 系统 ( Autonomous System, AS) 来 解决 ， 
每 个 AS 由 一 组 通常 处 在 相同 管理 控制 下 的 路 由 带 组 成 (例如 ， 由 相同 的 ISP 运营 或 属于 
相同 的 公司 网 络 )。 在 相同 的 AS 中 的 路 由 需 都 全 部 运行 同样 的 路 由 选择 算法 (如 一 种 LS 
或 DV 算法 ) ， 且 拥有 彼此 的 信息 ， 这 就 像 在 前 一 节 中 所 讲 的 理想 化 模型 中 的 情况 一 样 。 
在 一 个 自治 系统 内 运行 的 路 由 选择 算法 叫做 自治 系统 内 部 路 由 选择 协议 ( intra- autonomous 
system routing protocol) 。 当 然 ， 将 AS 彼此 互联 是 必需 的 ， 因 此 在 一 个 AS 内 的 一 台 或 多 台 
路 由 需 将 有 另外 的 任务 ， 即 负责 回 在 本 AS 之 外 的 目的 地 转发 分 组 。 这 些 路 由 天 被 称 为 网 
天 路 由 器 (gateway router) 。 

图 4-32 提供 了 具有 3 个 AS 的 简单 例子 : ASI, AS2 和 AS3。 在 该 图 中 ， 粗 线 表 示 了 
路 由 器 对 之 间 的 直接 链 路 连接 。 从 路 由 需 连 出 的 细 线 表示 直接 与 路 由 器 连接 的 子 网 。AS1 
具有 4 台 路 由 需 ，la、1lb、lc 和 1d， 它 们 运行 在 AS] 内 部 ， 使 用 了 ASI 内 部 路 由 选择 协议 。 
因此 , 这 4 台 路 由 天 的 每 一 台 都 知道 如 何洁 着 优化 路 径 转 发 到 ASI 内 任何 目的 地 的 分 组 。 类 
似 地 ， 目 治 系统 AS2 和 AS 每 个 都 有 3 人 台 路 由 顺 。 注 意 到 运行 在 AS1 AS2 和 AS3 中 的 AS 
内 部 路 由 选择 不 必 是 相同 的 。 同 时 注意 到 路 由 器 lb. le, 2a 和 3a 部 是 网 关 路 由 融 。 





AS 内 部 路 AS 间 路 由 
由 选择 算法 选择 算法 


转发 表 





图 4-32 ”一 个 互联 的 自治 系统 的 例子 


现在 应 当 清 楚 在 一 个 As 中 的 路 由 带 是 怎样 为 在 As 内 部 的 源 和 目的 对 决定 路 由 选择 
路 径 的 。 但 是 对 于 痪 到 闪 路 由 选择 难题 仍然 有 一 大 块 遗 油 的 部 分 ， 即 在 东 些 AS 中 一 台 路 
由 带 ， 怎 样 知 道 该 如 何 将 分 组 路 由 选择 到 位 于 该 AS 外 部 的 目的 地 呢 ? 如 果 AS 仅 有 一 个 
网 关 路 由 希 连 接 唯一 一 个 其 他 AS 的 话 ， 回 答 这 个 问题 是 容易 的 。 在 这 种 情况 下 ， 因 为 该 
AS 内 部 的 AS 路 由 选择 协议 已 经 决定 了 从 内 部 路 由 硕 到 网 天 路 由 硕 的 最 低 费 用 路 径 ， 因 此 
每 台 内 部 路 由 需 知 道 它 应 当 如 何 转发 分 组 。 网 关 路 由 融 一 旦 接收 到 分 组 ， 将 分 组 回 通 回 外 
部 AS 的 一 条 链 路 转发 。 该 链 路 另 一 端的 AS 承担 起 将 该 分 组 问 其 最 终 目 的 地 路 由 选择 的 
责任 。 举 一 个 例子 ， 假 定 在 图 4-32 中 的 路 由 大 2b 接收 到 一 个 分 组 ， 其 目的 地 位 于 AS2 的 
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Shab. Heth as 2b 则 将 该 分 组 转发 到 路 由 需 2a 或 2c， 这 由 路 由 天 2b 的 转发 表 指 定 ， 该 转 
发 表 由 AS2 AY AS 内 部 路 由 选择 协议 所 配置 。 该 分 组 最 后 到 达 网 关 路 由 器 2a, 2a 又 将 分 组 
转发 到 1b。 一 旦 该 分 组 离开 2a, AS2 对 这 个 分 组 的 任务 就 完成 了 。 

因此 当 源 AS 仅 有 一 条 通 回 外 部 AS 的 链 路 时 ， 容 易 解 决 该 问题 。 如 果 源 AS 具有 两 条 
或 更 多 条 链 路 (通过 一 台 或 更 多 台 网 关 路 由 需 ) 通 回 外 部 AS， 人 情况 将 会 怎样 呢 ? ERT e 
何 处 转发 分 组 的 问题 变 得 更 具 挑 战 性 。 例 如. 考虑 在 ASl 中 的 一 台 路 由 器 ， 假 定 它 接收 了 
一 个 目的 地 在 该 AS 外 部 的 分 组 。 路 由 融 显 然 应 当 辕 它 的 两 个 网 关 路 由 天 之 一 (1b ak ilce) 
转发 该 分 组 ， 但 到 底 是 哪个 呢 7 为 了 解决 这 个 问题 ，AS1 需要 : 山 知 道 经 AS2 可 达 哪 些 目 
的 地 ， 经 AS3 可 达 哪 些 目的 地 ; O ASL 中 的 所 有 路 由 天 传 播 这 些 可 达 性 信息 ， 因 此 每 从 
路 由 需 能 够 配置 它 的 转发 表 以 处 理 外 部 AS 目的 地 。 从 相 邻 AS 获取 可 达 性 信息 和 同 该 AS 
中 所 有 路 由 需 传 播 可 达 性 信息 是 两 项 由 自治 系统 间 路 由 选择 协议 (inter- autonomous system 
routing protocol) 处 理 的 任务 。 因 为 自治 系统 间 路 由 选择 协议 涉及 两 个 AS 之 间 的 通信 ， 这 
两 个 通信 的 AS 必须 运行 相同 的 自治 系统 间 路 由 选择 协议 。 事 实 上 ， 因 特 网 中 的 所 有 AS 中 
部 运行 相同 的 AS 间 路 由 选择 协议 ， 该 协议 称 为 BGP4， 我 们 将 在 下 一 节 中 讨论 。 如 图 4-32 
Aras, BEC BR ARKOK A — AS 内 部 路 由 选择 协议 和 一 个 AS 间 路 由 选择 协议 的 信息 ， 
并 使 用 来 自 这 两 个 协议 的 信息 配置 它 的 转发 表 。 

举 一 个 例子 ， 考 虑 子 网 x ( 用 它 的 CDIR 化 的 地 址 标识 ) ， 假 定 ASI 从 AS 间 路 由 选择 
内 议 知 道子 网 x 从 AS3 可 达 ， 而 从 AS2 不 可 达 。AS1 则 回 它 的 所 有 路 由 郑 传播 这 个 信息 : 
“SHH ae 1d 知道 从 AS3 并 因此 从 网 关 lc 可 达 子 网 x 时 ,根据 AS 内 部 路 由 选择 协议 提供 
的 信息 ， 它 进而 确定 该 路 由 融 接 口 位 于 从 路 由 顺 1d 到 网 关 路 由 需 1c 的 最 低 费 用 路 从 上 ， 
比如 这 是 接口 1。 路 由 器 1d 则 能 够 将 表 项 (x, 1) 放 入 其 转发 表 中 。 (这 个 例子 和 在 本 市 
中 给 出 的 其 他 例子 ， 体 现 了 因特网 中 实际 发 生 情况 的 一 般 但 被 简化 的 概念 。 在 下 一 节 中 ， 
当 我 们 讨论 BGP 时 ， 将 提供 一 个 更 为 详细 的 摘 述 ， 尽 管 它 更 为 复杂 - ) 

接着 上 面 的 例子 ， 现 在 假设 AS2 和 AS3 与 其 他 AS 相连 ， 这 些 AS 并 没有 在 该 图 上 显 
示 出 来 。 同 时 假定 AST 从 AS 间 路 由 选择 协议 知道 了 子 网 x 是 可 达 的 : 或 者 从 AS2 经 网 关 
Ib, RAM AS3 经 网 关 les ASI 则 将 辐 它 的 所 有 路 由 郑 〈 包 括 路 由 部 ld) 传播 该 信息 ， 
为 了 配置 它 的 转发 表 ， 路 由 占 1d 将 必须 决定 通过 1b 或 1c 网 关 路 由 咒 中 的 哪个 来 指引 目 
的 地 为 子 网 x 的 分 组 。 在 实践 中 经 贡 使 用 的 一 种 方法 是 热土 豆 路 由 选择 (hot potato routing) 。 
在 热土 豆 路 由 选择 中 ，AS 尽 可 能 快 地 (更 准确 地 讲 是 尽 可 能 经 济 地 ) 扔 掉 分 组 (热土 
豆 )。 这 通过 让 路 由 器 问 某 网 关 路 由 紫 发 送 分 组 来 完成 ， 同 时 该 网 关 路 由 带 在 到 目的 地 路 
径 上 的 所 有 网 关 路 由 器 中 有 最 低 的 路 由 器 到 网 关 的 费用 。 在 当前 例子 环境 中 ， 在 1d 中 运 
行 的 热土 豆 路 由 选择 将 使 用 来 自 AS 内 部 路 由 选择 协议 的 信息 ， 以 决定 到 1b 和 1c 的 路 径 
费用 ， 并 选择 具有 最 低 费 用 的 路 径 。 一 旦 选择 这 条 路 径 ， 路 由 噩 ld 在 其 转发 表 中 增加 用 
于 子 网 x 的 表 项 。 图 4-33 总 结 了 路 由 器 1d 对 转发 表 增 加 用 于 * 的 表 项 所 采取 的 动作 。 
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图 4-33 ”在 路 由 器 的 转发 表 中 增加 一 个 AS 之 外 目的 地 的 步骤 
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当 一 个 AS 从 一 个 相 邻 AS 处 知道 了 一 个 目的 地 ， 该 AS 能 够 回 它 的 某 些 其 他 相 邻 AS 
通告 该 路 由 选择 信息 。 例 如 ， 假 定 ASI 从 AS2 处 知道 了 经 AS2 能 到 达 子 网 x*。ASI1 则 能 够 
告诉 AS3 经 ASI 能 到 达 x。 以 这 种 方式 ， 如 果 AS3 需要 为 一 个 目的 地 是 x 的 分 组 路 由 的 
话 ，AS3 将 回 ASI 转发 该 分 组 ，AS1 将 依次 同 AS2 转发 该 分 组 。 如 我 们 将 在 讨论 BGP 时 
所 见 ， 一 个 AS 在 决定 向 其 相 邻 AS 通告 哪些 目的 地 时 ， 有 具有 相当 大 的 灵活 性 。 这 是 一 个 
策略 决定 ， 通 稼 更 多 地 取决 于 经 济 问题 而 不 是 技术 问题 。 

1.5 节 讲 过 ， 因 特 网 是 由 等 级 制 的 互联 ISP 组 成 。 那 么 ISP 和 AS 之 间 是 什么 样 的 关系 
ME? 你 也 许 认 为 在 一 个 ISP 中 的 路 由 右 和 互联 它们 的 链 路 构成 了 单个 AS。 虽然 经 常 是 这 种 
情况 ,但 许多 ISP 将 它们 的 网 络 划 分 为 多 个 AS。 例如， 某 些 第 一 层 ISP 对 它们 的 整个 网 络 
使 用 一 个 AS; 其 他 ISP 则 将 它们 的 ISP 划分 成 数 十 个 互联 的 AS, 

总 而 言 之 ， 规 模 与 管理 责任 的 问题 可 通过 定义 自治 系统 来 解决 。 在 一 个 AS 内 部 ， 所 
有 路 由 需 运 行 同样 的 上 自治 系 统 内 部 路 由 选择 协议 。 在 各 AS 之 间 ，AS 运行 相同 的 AS 间 路 
由 选择 协议 。 因 为 一 个 AS 内 部 路 由 需 仅 需要 知道 本 AS 内 的 路 由 句 ， 扩 展 性 问题 得 到 了 
解决 。 因 为 一 个 组 织 可 运行 它 选 择 的 任何 AS 内 部 路 由 选择 协议 ， 管 理 责 任 的 问题 得 到 了 
解决 ; 然而 ， 相 连 的 每 对 AS 需要 运行 相同 的 AS 间 路 由 选择 协议 以 交换 可 达 性 信息 。 

在 下 一 市 中 ,我们 将 学 习 当 今 因 特 网 中 使 用 的 两 种 AS 内 部 路 由 选择 协议 ( RIP 与 
OSPF) 和 一 种 AS 间 路 由 选择 协议 (BGP)。 这 些 学 习 案 例 将 很 好 地 从 不 同 侧面 帮助 我 们 
学 习 层 次 路 由 选择 内 容 


4.6 因特网 中 的 路 由 选择 


学 习 了 因特网 编 址 与 IP 协议 以 后 ,我 们 现在 将 注意 力 转 到 因特网 路 由 选择 协议 上 来 。 
路 由 选择 协议 的 任务 束 是 要 确定 数据 报 在 源 与 目的 地 之 间 来 用 的 路 笃 。 我 们 将 看 到 ， 因 特 
网 的 路 由 选择 协议 包含 了 许多 我 们 在 本 革 前 面 学 过 的 原理 。 在 4.5.1 节 和 4.5.2 节 中 学 过 
的 链 路 状态 与 距离 回 量 方法 ， 以 及 在 4. 5.3 节 中 考虑 的 自治 系统 概念 ， 这 些 都 在 当今 的 因 
特 网 的 路 由 选择 过 程 中 起 到 至 关 重 要 的 作用 。 

在 4.5.3 市 中 讲 过 ,一 个 AS 是 一 个 处 于 相同 的 管理 与 技术 控制 下 的 路 由 器 的 集合 ， 
在 AS 之 间 都 运行 相同 的 路 由 选择 协议 。 每 个 AS 通常 又 部 包含 多 个 子 网 (这 里 使 用 的 术 
语 子 网 具有 4.4.2 节 中 的 精确 、 编 址 的 含义 ) 。 


4.6.1 因特网 中 自治 系统 内 部 的 路 由 选择 : RIP 


AS 内 部 路 由 选择 协议 用 于 确定 在 一 个 AS 内 执行 路 由 选择 的 方式 。AS 内 部 路 由 选择 
协 以 又 称 为 内 部 网 关 协 议 (interior gateway protocol), 。 历 史上 有 两 个 路 由 选择 协议 兽 被 广 
沁 用 于 因特网 上 日 治 系 统 内 的 路 由 选择 : 路 由 选择 信息 协议 (Routing Information Protocol, 
RIP) 与 开放 最 短路 优先 (Open Shortest Path First，OSPF ) 。 与 OSPF 密切 相关 的 路 由 选择 
协议 是 IS-IS 协议 [RFC 1142; Perlman 1999 ] 。 我 们 首先 讨论 RIP， 然 后 考虑 OSPF, 

RIP 是 最 早 的 AS 内 部 因特网 路 由 选择 协议 之 一 ， 且 目前 仍 在 广泛 使 用 。 它 的 产生 与 
命名 源 于 Xerox 网 络 系统 (XNS) 体系 结构 。RIP 的 广泛 应 用 主要 是 由 于 它 被 包含 在 支持 
TCP/IP 的 1982 年 的 UNIX 伯克利 软件 分 发 (BSD) 版 本 中 。 在 [RFC 1058] 中 定义 了 
RIP 版 本 1, 在 | RFC 2453) 中 定义 了 其 向 后 兼容 的 版 本 2。 
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RIP Jé— BREE S nj PI, Hoe rr RRR TE 4. 5. 2 TPE DV HM. 
在 RFC 1058 中 定义 的 RIP 版 本 使 用 跳 数 作为 其 费用 测度 ， 即 每 条 链 路 的 费用 为 1。 在 
4.5.2 节 的 DV 算法 中 ， 为 了 简单 起 见 ， 费 用 被 定义 在 路 由 磅 对 之 间 。 在 RIP (也 在 OSPF ) 
中 ， 费 用 实际 上 是 从 源 路 由 器 到 目的 子 网 。RIP 使 用 术语 跳 ， 跳 是 沿 看 从 源 路 由 表 到 日 的 
子 网 (包括 目的 子 网 ) 的 最 短路 径 所 经 过 的 子 网 数量 。 图 4-34 举例 说 明了 一 个 具有 6 个 
叶子 子 网 的 AS。 在 该 图 中 的 表 指出 了 从 源 A 到 每 个 叶子 子 网 的 跳 数 ， 
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图 4-34 Wie as A 到 各 个 子 网 的 跳 数 


一 条 路 径 的 最 大 费用 被 限制 为 15， 因此 RIP 的 使 用 限制 在 网 络 直径 不 超过 15 BEY A 
治 系统 内 。 前 面 讲 过 在 DV 协议 中 ， 相 邻 路 由 器 之 间 相 互 交 换 路 由 选择 信息 。 任何 一 台 路 
由 吾 的 距离 向 量 是 从 这 台 路 由 需 到 该 As 中 子 网 的 最 短路 径 距 离 的 当前 估计 值 。 在 RIP 中 ， 
路 由 选择 更 新 信息 在 邻居 lel naar 一 种 RIP 响应 报 文 ( RIP response message) 来 交 
换 ， 大 约 每 30 秒 相互 交换 一 次 。 由 一 台 路 由 器 或 主机 发 出 的 啊 应 报 文 包含 了 一 个 该 AS 内 
的 多 达 25 个 目 caine. oe ae 到 其 中 每 个 子 网 的 距离 。 啊 应 报 文 又 被 称 作 
RIP 通告 (RIP advertisement) 。 
我 们 考察 有 关 RIP 通告 是 如 何 工 作 的 一 个 简单 例子 。 考 虑 在 图 4-35 中 显示 的 一 个 AS 
的 一 部 分 。 在 该 图 中 ， 连 接 路 由 器 的 线 表示 子 网 。 仅 有 选中 的 路 由 着 (A, B, C, D) 与 
网 络 (wy x, ya 2) 被 标记 了 。 虚 线 指示 了 该 AS 还 在 继续 ， 因 此 该 自治 系统 有 比 图 示 更 
多 的 路 由 融和 链 路 。 





图 4-35 一 个 自治 系统 的 一 部 分 


每 台 路 由 器 维护 一 张 称 为 路 由 选择 表 (routing table) 的 RIP K, 一 台 路 由 各 的 路 由 选 
择 表 包 括 该 路 由 器 的 距离 向 量 和 该 路 由 顺 的 转发 表 。 网 4-36 显示 了 路 由 豆 D 的 转发 表 ， 
注意 到 该 转发 表 有 3 列 。 第 一 列 用 于 目的 子 网 ， 第 二 列 指示 了 党 看 最 短路 径 到 目的 子 网 的 
下 一 个 路 由 器 的 标识 ,第 三 列 指出 了 沿 着 最 短路 径 到 目的 子 网 的 跳 数 ( 即 知 要 穿越 的 子 网 
数 ， 包 插 日 的 子 网 ) 。 对 于 该 例 而 言 ， 该 表 指 出 了 从 路 由 费 D 到 目的 子 网 w 发 送 一 个 数据 
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报 ， 该 数据 报应 首先 被 转发 到 相 邻 路 由 需 A; 该 表 还 指出 沿 着 最 短路 径 到 目的 子 网 we 为 两 
HJER. 类 似 了 地， 该 表 指 出 了 子 网 z 经 由 路 
由 器 B 为 7 跳 距 离 。 虽然 RIP 版 本 2 人 允许 使 目的 子 网 FARMA 到 目的 地 的 跳 数 
用 类 似 于 我 们 在 4.4 节 中 学 习 的 路 由 聚合 技 
术 来 聚合 子 网 表 项 ， 但 原则 上 AS 内 的 每 个 
子 网 应 在 转发 表 中 占 一 行 。 在 图 4-36 中 的 
表 以 及 后 续 的 表 ， 痢 只 是 部 分 完成 了 . 
现在 假定 30 秒 以 后 ， 路 由 器 D 收 到 来 
By 和 FAE zg 4-36 kak A BS A 的 通告 
到 该 通告 正 是 来 月 路 由 硕 A 的 路 由 选择 表 信 
息 ! 该 信息 特别 指明 了 子 网 z 离 路 由 需 A 仅 有 4 跳 距 离 。 一 旦 收 到 该 通告 ， 路 由 器 D 将 该 
通告 (网 4-37) 与 日 路 由 选择 表 (图 4-36) 合并 。 特 别 是 路 由 器 D 知道 了 通过 路 由 器 A 
到 子 网 z 比 通 过 路 由 各 B 到 达 路 径 更 短 。 因 此 ， 路 由 需 D 更 新 其 转发 表 以 记 下 该 更 短 的 最 
短路 径 ， 如 图 4-38 中 所 示 。 你 也 许 会 问 ， 到 子 网 z 的 最 短路 径 怎 么 会 变 得 更 短 呢 ? 可 能 是 
分 布 式 的 距离 回 量 算法 还 处 在 收敛 过 程 中 (参见 4.5.2 节 )， 或 者 也 许 是 新 的 链 路 和 /或 路 
由 天 加 入 了 该 AS， 因 此 改变 了 在 AS 中 的 最 短路 径 。 


目的 子 网 FAH at 到 目的 地 的 跳 数 








目的 于 网 Fee eh at 到 目的 地 的 跳 数 








图 4-37 来 自 路 由 器 A 的 通告 图 4-38 KERKE A 的 通告 后 路 由 器 D 中 的 转发 表 


我 们 下 面 考虑 RIP 实现 方面 的 几 个 问题 。 前 面 讲 过 RIP 路 由 需 大 约 每 30 秒 相 互 交 互 
通告 。 如 有 果 一 台 路 由 器 一 旦 超过 180 秒 没 有 从 邻居 听 到 报 文 ， 则 该 邻居 不 再 被 认为 是 可 达 
的 ; 即 要 么 其 邻居 死机 了 ， 要 么 连接 的 链 路 中 断 了 。 当 这 种 情况 发 生 时 ，RIP 修改 本 地 路 
由 选择 表 ， 然 后 通过 回 相 邻 路 由 器 (那些 仍然 可 达 的 路 由 器 ) 发 送 通告 来 传播 该 信息 。 路 
由 右 也 可 通过 使 用 RIP 请 求 报 文 ， 请 求 其 邻居 到 指定 目的 地 的 费用 。 路 由 器 在 UDP 上 使 
用 端口 520 相互 发 送 RIP 请 求 与 响应 报 文 。 封 装 在 标准 IP 数据 报 中 的 UDP 报 文 段 在 路 由 
at lal fei. RIP 使 用 一 个 位 于 网 络 层 协议 (IP) 之 上 的 运输 层 协议 (UDP) 来 实现 网 络 
层 功 能 (一 种 路 由 选择 算法 )， 这 个 事实 看 起 来 似乎 相当 令 人 费解 (事实 如 此 !) 。 若 再 深 
人 一 些 观 察 RIP 的 实现 原理 将 能 更 明白 这 一 点 。 

图 4-39 概略 地 说 明了 RIP 在 一 个 UNIX 系统 中 通常 是 如 何 实 现 的 ， 例 如 一 台 用 作 路 由 
arty) UNIX 工作站。 一 个 称 为 routed 的 进程 执行 RIP， 即 维护 路 由 选择 信息 并 与 相 邻 路 由 
far PAY routed 进程 交换 报 文 。 因 为 RIP 是 被 当 作 一 个 应 用 层 进程 来 实现 的 (虽然 它 是 一 个 
能 操作 UNIX 内 核 中 的 转发 表 的 特殊 进程 )， 它 能 在 一 个 标准 套 接 字 上 发 送 和 接收 报 文 ， 
并 且 使 用 一 个 标准 的 运输 层 协议 。 如 显示 的 那样 ，RIP 是 一 个 运行 在 UDP 上 的 应 用 层 协议 
(参见 第 2 竟 ) 。 如 果 读 者 有 意 关 注 RIP (或 我 们 将 很 快 学 习 的 OSPF 和 BGP 协议 ) 的 实 
现 ， 请 参阅 [Quagga 2012 ] 。 
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图 4-39 作为 routed 守护 程序 的 RIP 实现 


4.6.2 因特网 中 上 自治 系统 内 部 的 路 由 选择 : OSPF 


就 像 RIP 一 样 ，OSPF 路 由 选择 也 被 广泛 用 于 因特网 的 AS 内 部 路 由 选择 。OSPF AE AY 
关系 密切 的 表 兄 第 IS-IS 通常 都 设置 在 上 层 的 ISP 中 ， 而 RIP Alpi AE Be ISP 和 企业 网 
中 。OSPF 中 的 开放 (Open) 一 词 是 指 路 由 选择 协议 规范 是 公众 可 用 的 (与 之 相反 的 是 如 
Cisco 的 EIGRP 协议 ) 。OSPF 的 最 新 版 本 是 版 本 2， 由 RFC 2328 这 个 公用 文档 所 定义 ， 

OSPF 被 设想 为 是 RIP 的 后 继 者 ， 因 为 它 有 许多 先进 特性 。 然 而 ，OSPF 的 核心 就 是 一 
个 使 用 洪 泛 链 路 状态 信息 的 链 路 状态 协议 和 一 个 Dijkstra 最 低 费 用 路 径 算 法 .使 用 OSPF, 
一 台 路 由 器 构建 了 一 幅 关 于 整个 自治 系统 的 完整 拓扑 图 ( 即 一 个 网 ) 。 于 是 ， 路 由 器 在 本 
地 运行 Dijkstra 的 最 短路 径 算法 ， 以 确定 一 个 以 自身 为 根 结 点 的 到 所 有 子 网 的 最 短路 径 树 . 
各 条 链 路 费用 是 由 网 络 管理 员 配 置 的 (参见 “实践 原则 : 设置 OSPF 链 路 权 值 ” ) 。 管理 员 
也 许 会 选择 将 所 有 链 路 费用 设 为 1， 因 而 实现 了 最 少 跳 数 路 由 选择 ， 或 者 可 能 会 选择 将 链 
路 权 值 按 与 链 路 容量 成 反比 来 设置 ， 从 而 不 辟 励 流量 使 用 低 囊 宽 链 路 。OSPF 不 强制 使 用 
如 何 设置 链 路 权 值 的 策略 〈 那 是 网 络 管理 员 的 任务 ) ， 但 提供 了 一 种 机 制 (协议 )， 为 给 
定 链 路 权 值 集合 确定 最 低 费 用 路 径路 由 选择 。 

使 用 OSPF 时 ， 路 由 规 回 自治 系统 内 所 有 其 他 路 由 需 广 播 路 由 选择 信息 ， 而 不 仅仅 是 
回 其 相 邻 路 由 震 广 播 . 每 当 一 条 链 路 的 状态 发 生变 化 时 〈 如 费用 的 变化 或 连接 /中 断 状 态 
的 变化 ) ， 路 由 器 就 会 广播 链 路 状态 信息 。 即使 链 路 状态 未 发 生变 化 ， 它 也 要 周期 性 地 
(至 少 每 隔 30 分 钟 一 次 ) 广播 链 路 状态 。RFC 2328 中 有 这 样 的 说 明 :“ 链 路 状态 通告 的 这 
种 周期 性 的 更 新 增加 了 链 路 状态 算法 的 健壮 性 ”0OSPF 通告 包含 在 OSPF 报 文 中 ， 该 OSPF 
报 文 直接 由 IP 承载 ， 对 OSPF 其 上 层 协议 的 值 为 89。 因 此 OSPF 协议 必须 自己 实现 诸如 可 靠 
报 文 传输 、 链 路 状态 广播 等 功能 。OSPF 协议 还 要 检查 链 路 正在 运行 (通过 加 相连 的 邻居 发 
送 HELLO 报 文 ) ， 并 人 允许 OSPF 路 由 需 获 得 相 邻 路 由 需 的 网 络 范围 链 路 状态 的 数据 库 . 

OSPF 的 优点 包括 下 列 几 方面 : 

© 安全 。 能 够 鉴别 OSPF 路 由 器 之 间 的 交换 (如 链 路 状态 更 新 ) 。 使 用 鉴别 ， 仅 有 受 

信任 的 路 由 器 能 参与 一 个 AS 内 的 OSPF 协议 ， 因 此 可 防止 恶意 入 侵 者 (或 正在 利 
用 新 学 的 知识 到 处 试探 的 网 络 专业 的 学 生 ) 将 不 正确 的 信息 注入 路 由 太 表 内 ,在 
默认 状态 下 ， 路 由 需 间 的 OSPF 报 文 是 未 被 鉴别 的 并 能 被 伪造 能 够 配置 两 类 鉴 
别 ， 即 简单 的 和 MDS 的 (参见 第 8 草 有 关 MDS 和 鉴别 的 一 般 性 讨论 ) 。 使 用 简单 


的 鉴别 ， 每 台 路 由 器 配置 相同 的 口令 。 当 一 台 路 由 需 发 送 一 个 OSPF 分 组 ， 它 以 明 
文 方式 包括 了 口令 。 显然， 简单 鉴别 并 不 是 非常 安全 。MD5 鉴别 基于 配置 在 所 有 
路 由 郑 上 的 共享 秘密 密 钥 。 对 每 个 发 送 的 OSPF 分 组 ， 路 由 硕 对 附加 秘密 密 钥 的 分 
组 内 容 计 算 MDS 散 列 值 。( 参 见 第 7 章 中 报 文 鉴 别 公 的 讨论 ;) 然后 它 将 所 得 的 散 
列 值 包括 在 该 OSPF 分 组 中 ， 接收 路 申 需 使 用 预 配 置 的 秘密 密 钥 计算 出 该 分 组 的 
MDS 散 列 值 ， 并 与 该 分 组 携带 的 散 列 值 进行 比较 ， 从 而 验证 了 该 分 组 的 真实 性 ， 
在 MDS 鉴别 中 也 使 用 了 序号 对 重 放 攻击 进行 保护 。 

© 多 条 相同 费用 的 路 径 。， 当 到 达 某 目的 地 的 多 条 路 径 有 具有 相同 的 费用 时 ，OSPF 允许 
使 用 多 条 路 径 (这 就 是 说 ， 当 多 条 相等 费用 的 路 径 存 在 时 ， 无 需 仪 选择 单一 的 路 
径 来 承载 所 有 的 流量 ). 

e 对 单 播 与 多 播 路 由 选择 的 综合 支持 。 多 播 OSPF (MOSPF) [RFC 1584 提供 对 
OSPF 的 简单 扩展 ， 以 便 提供 多 播 路 由 选择 (这 是 在 4.7.2 TRAE AI ER). 
MOSPF 使 用 现 有 的 OSPF 链 路 数据 库 ， 并 为 现 有 的 OSPF 链 路 状态 广播 机 制 增加 了 
一 种 新 型 的 链 路 状态 通告 。 

© 支持 在 单个 路 由 选择 域内 的 层次 结构 。 也许 OSPF 最 重要 的 优点 是 具有 按 层次 结构 
构造 一 个 自治 系统 的 能 力 。 在 4.5.3 节 中 我 们 已 看 到 了 层次 路 由 选择 纺 构 的 许多 
优点 。 在 本 节 剩 余部 分 ， 我 们 将 学 习 OSPF 层次 路 由 选择 的 实现 . 

-个 OSPF 月 治 系统 可 以 配置 成 多 个 区 域 。 每 个 区 域 都 运行 月 己 的 OSPF 链 路 状态 路 
由 选择 算法 ， 一 个 区 域内 的 每 台 路 由 器 都 回 该 区 域内 的 所 有 其 他 路 由 需 广 播 其 链 路 状态 . 
在 一 个 区 域内 ， 一 人 台 或 多 台 区 域 边界 路 由 器 (area border router) 负责 为 流 回 该 区 域 以 外 
的 分 组 提供 路 由 选择 。 最 后 ,在 AS 内 只 有 一 个 OSPF 区 域 配置 成 主干 (backbone) 区 域 . 
主干 区 域 的 主要 作用 是 为 AS 内 其 他 区 域 之 间 的 流量 提供 路 由 选择 。 该 主干 总 是 包含 了 AS 
内 的 所 有 区 域 边 界 路 由 器 ， 并 且 可 能 还 包含 了 一 些 非 边 界 路 由 上 。 在 AS 内 的 区 域 间 的 路 
由 选择 要 求 分 组 首先 路 由 到 一 个 区 域 边界 路 由 器 (区 域内 路 由 选择 )， 再 通过 主干 路 由 到 
位 于 目的 区 域 的 区 域 边 界 路 由 融 ， 然 后 再 路 由 到 最 终 目 的 地 。 
OSPF 是 一 个 相当 复杂 的 协议 ， 而 我 们 这 里 的 讨论 是 十 分 简要 的 ， [Huitema 1998 ; 
Moy 1998; RFC 2328] 提供 了 更 多 的 细节 。 


设置 OSPF 链 路 权 值 


我 们 有 关 链 路 状态 路 由 选择 的 讨论 隐 仿 地 假设 了 下 列 事 实 : 链 路 权重 已 经 设置 好 
了 ,运行 了 诸如 OSPF 这 样 的 路 由 选择 算法 ,流量 根据 由 LS 算法 计算 所 得 的 路 由 选择 表 
流动 . 就 原 果 而 言 ， 给 定 链 路 权重 ( 即 它们 先 发 生 )， 结 果 得 到 (经 Dijkstra 算法 ) 最 
小 化 总 体 费 用 的 路 由 选择 路 径 。 从 这 个 角度 看 ， 链 路 权重 反映 了 使 用 一 条 链 路 的 费用 
(例如 ， 如 果 链 路 权重 与 容量 成 反比 ， 则 使 用 高 容量 链 路 将 具有 较 小 的 权重 并 因此 从 路 
由 选择 的 角度 更 有 吸引 力 )， 并 且 使 用 Dijkstra 算法 使 得 总 费用 为 最 小 。 

在 实践 中 ， 链 路 权重 和 路 由 选择 路 径 之 间 的 因果 关系 也 许 是 相反 的 ， 网 络 操作 员 配 
置 链 路 权重 ， 以 获取 某 些 流量 工程 目标 的 路 由 选择 路 径 [Fortz 2000; Fortz 2002]. 例如， 


假设 某 网 络 操作 员 具 有 在 每 个 入 口 点 进入 和 发 向 每 个 出 口 点 的 进入 网 络 的 流量 估计 。 该 操 
作 员 接 下 来 可 能 要 设置 特定 入 口 到 出 口 的 流 路 由 选择 ， 以 最 小 化 经 所 有 网 络 链 路 的 最 大 利 
用 率 。 但 使 用 如 OSPF 这 样 的 路 由 选择 算法 ， 操 作 员 调节 通过 网 络 的 流 的 路 由 选择 ， 主 要 
手段 是 链 路 权重 。 因 此 ， 为 了 取得 最 小 化 最 大 链 路 利用 率 的 目标 ， 该 操作 员 必 须 找 出 取得 
该 目标 的 链 路 权重 集合 。 这 是 一 种 相反 的 因果 关系 ， 即 所 希望 的 流 路 由 选择 已 知 ， 必 须 找 
到 OSPF 链 路 权重 ， 使 得 该 OSPF 路 由 选择 算法 导致 这 种 希望 的 流 路 由 选择 ， 


4. 6.3 自治 系统 间 的 路 由 选择 : BGP 


我 们 刚才 学 习 了 ISP 如 何 使 用 RIP 和 OSPF 来 决定 位 于 相同 AS 内 部 的 源 和 目的 对 之 间 
的 优化 路 答 。 我 们 现在 人 研究 一 下 ， 跨 越 多 个 AS 的 源 和 目的 对 之 间 是 如 何 确定 路 径 的 由 
RFC 4271 ( 亦 可 参见 [ REC 4274 | ) 定义 的 边界 网 关 协 议 ( Broder Gateway Protocol, BGP) 
版 本 4 是 当今 因特网 中 域 间 路 由 选择 协议 事实 上 的 标准 。 它 通常 被 称 为 BGP4 ak fj PRY 
BCP。 作 为 一 个 自治 系统 间 路 由 选择 协议 (参见 4.5.3 47), BOP 为 每 个 AS 提供 了 进行 以 

1) 从 相 邻 AS 处 获得 子 网 可 达 性 信息 。 

2) Æ AS 内 部 的 所 有 路 由 硕 传 播 这 些 可 达 性 信息 。 

3) 基于 可 达 性 信息 和 AS 策略 ， 决 定 到 达 子 网 的 “好 ”路 由 。 

更 为 重要 的 是 ，BGP 使 得 每 个 子 网 向 因特网 的 其 余部 分 通告 它 的 存在 。 一 个 子 网 高 声 
Am RFE, RERE”, HH BGP 确保 在 因特网 中 的 所 有 AS 知道 该 子 网 以 及 如 何 到 
达 那 里 。 如 果 没 有 BGP 的 话 ， 每 个 子 网 将 是 隅 离 的 ， 即 它们 孤独 并 且 不 为 因特网 其 余部 
分 所 知 。 

1. BGP 基础 

BGP 极其 复杂 ， 许 多 专著 致力 于 研究 该 主题 ， 而 且 许 多 问题 仍 没有 得 到 很 好 理解 
[ Yannuzzi 2005 ] 。 此 外 ， 作 为 较 高 层 ISP 的 设计 者 或 管理 员 ， 即 使 在 阅读 了 这 些 专著 和 这 些 
RFC 以 后 ， 如 果 不 花 数 月 ( 即使 不 是 数 年 ) 实际 实践 BOP 的 话 ， 可 能 发 现 难以 全 面 掌握 
BGP, 无论 如 何 ， 因 为 BGP 是 因特网 中 绝对 至 关 重 要 的 协议 ， 即 从 本 质 上 讲 ， 正 是 这 个 协议 
将 所 有 的 东西 粘 合 在 一 起 了 ， 因 此 我 们 至 少 需要 获得 该 协议 工作 原理 的 初步 知识 。 我 们 从 描 
述 BGP 在 简单 的 例子 网 络 环境 下 如 何 工 作 开始 ， 我 们 曾 在 图 4-32 中 学 习 过 该 例子 网 络 。 在 
下 面 的 描述 中 ， 我 们 的 讨论 将 基于 4.5.3 节 中 的 层次 路 由 选择 ， 硕 望 读者 能 复习 一 下 该 材料 。 

在 BGP 中 ， 路 由 希 对 通过 使 用 179 im O AJKA TCP 连接 来 交换 路 由 选择 信息 。 对 
于 图 4-32 中 的 网 络 而 言 ， 该 半 永 久 TCP 显示 在 图 4-40 中 。 对 于 每 条 直接 连接 位 于 两 个 不 
同 的 AS 中 的 路 由 需 的 链 路 而 言 ， 通 常 有 一 条 这 样 的 BGP TCP 连接 。 因 此 ， 在 图 4-40 tF, 
在 网 关 路 由 需 3a 和 1c 之 间 有 一 条 TCP 连接， 在 网 关 路 由 大 lb 和 2a 之 间 有 男 一 条 TCP j£ 
接 。 在 一 个 AS 中 的 路 由 器 之 间 还 有 许多 半 永 久 BGP TCP 连接 。 特 别 是 ， 图 4-40 显示 了 一 
个 AS 内 部 的 每 对 路 由 器 之 间 的 一 条 TCP 连接 的 通常 配置 ， 在 每 个 AS 内 部 产生 了 网 状 的 
TCP 连接 。 对 于 每 条 TCP 连接 ， 位 于 该 连接 端点 的 两 台 路 由 融 称 为 BGP 对 等 方 (BGP 
peers ) ， 沿 看 该 连接 发 送 所 有 BGP 报 文 的 TCP 连接 称 为 BGP 会 话 (BGP session), IL, 
跨越 两 个 AS AY BGP 会 话 称 为 外 部 BGP (eBGP) 会 话 (external BGP session) ， 在 同一 个 
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AS 中 的 两 台 路 由 器 之 间 的 BGP 会 话 称 为 内 部 BGP (IBGP) 会 话 (internal BGP session). 
在 图 4-40 F, eBGP 会 话 显 示 为 长 虚线 ，iBCP 会 话 显示 为 短 虚线 。 注 意 到 网 4-40 中 的 
BGP 会 话 线 并 不 总 是 与 图 4-32 中 的 物理 链 路 对 应 < 
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图 4-40 eBGP 和 jiBGCP 会 话 





获得 因特网 的 存在 : 拼 好 拼图 


假定 你 刚刚 创建 一 个 有 一 些 服务 器 的 小 型 公司 网 络 ， 包 括 一 个 描述 你 所 在 公司 产品 和 
服务 的 公共 Web 服务 器 、 公 司 雇员 获得 电子 邮件 报 文 的 电子 邮件 服务 器 和 一 人 台 DNS 服务 
器 。 你 很 自然 地 希望 整个 世界 能 够 在 你 的 Web 站 点 上 冲浪 ， 知 道 你 那些 令 人 兴奋 的 产品 和 
服务 。 此外， 你 将 希望 公司 懂 员 能 够 向 遍及 全 球 的 潜在 用 户 发 送 和 接收 电子 邮件 。 

为 了 满足 这 些 目标 ， 你 先 要 获得 因特网 连通 性 。 为 做 到 这 一 点 ， 要 与 一 个 本 地 ISP 签 
订 合 同 并 与 之 连接 。 你 的 公司 将 要 有 一 台 网 关 路 由 器 ， 将 其 与 本 地 ISP 相连 接 。 这 种 连接 
可 以 是 通过 现 有 的 电话 基础 设施 的 DSL 连接 、 一 条 到 ISP 的 租用 线 , 或 在 第 1 章 中 描述 的 
许多 其 他 种 接 入 方案 之 一 。 你 的 本 地 ISP 也 将 为 你 提供 一 个 IP 地址 范围 ， 例 如 一 个 由 256 
个 地 址 组 成 的 /24 地 址 范围 。 一 旦 有 了 自己 的 物理 连接 和 IP 地 址 范围 ， 你 将 在 该 地 址 范围 
内 分 配 IP 地 址 : 一 个 给 你 的 Web 服务 器 ， 一 个 给 你 的 邮件 服务 器 ， 一 个 给 你 的 DNS 服务 
器 ， 一 个 给 你 的 网 关 路 由 器 ， 其 他 P 地 址 给 你 公司 网 络 中 的 其 他 服务 器 和 网 络 设备 。 

除了 与 一 个 ISP 签约 外 ， 你 还 需要 与 一 个 因特网 注册 机 构 签 约 ， 以 便 为 你 的 公司 获 

得 一 个 域名 ， 如 第 2 章 所 述 。 例 如 ， 如 果 你 的 公司 名 为 Xanadu 公司 ,你 当然 试图 获得 
P xanadu. com。 你 的 公司 还 必须 在 DNS 系统 中 存在 。 特 别 是 ， 因 为 外 部 要 与 你 的 
DNS 服务 器 联系 以 获得 服务 器 的 IP 地址 ， 你 还 需要 注册 你 的 DNS 服务 器 的 IP 地 址 。 你 
的 注册 机 构 则 将 你 的 DNS 服务 器 (域名 和 对 应 的 地 址 ) 放 入 . com 顶级 域名 服务 器 中 的 
一 个 表 项 中 ， 如 在 第 2 章 中 所 述 。 完 成 这 个 步骤 后 ， 知 道 你 域名 (如 xanadu. com) 的 任 
何 用 户 将 能 够 经 过 DNS 系统 获得 你 DNS 服务 器 的 IP 地址。 

为 了 使 人 们 能 够 发 现 你 Web 服务 器 的 下地 址 ， 你 需要 在 你 的 DNS 服务 器 中 包括 一 
个 将 你 的 Web 服务 器 名 字 (如 www. xanadu. com) 映射 为 其 IP 地 址 的 表 项 。 你 还 要 有 用 
于 其 他 公共 可 用 的 公司 服务 器 的 类 似 表 项 ， 包 括 你 的 邮件 服务 器 。 如 此 一 来 ， 如 果 Alice 
要 浏览 你 的 Web RAB, DNS 系统 将 联系 你 的 DNS 服务 器 ， 找 出 你 的 Web 服务 器 的 IP 
地 址 ， 并 将 其 提交 Alice, Alice 则 能 够 与 你 的 Web 服务 器 直接 创建 一 条 TCP 连接 。 
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然而 ， 允 许 来 自 全 世界 的 外 部 者 接 入 你 的 Web 服务 器 仍 存在 其 他 必要 的 、 决 定性 
的 步骤 .考虑 下 列 情 况 ， 假 设 Alice 知道 你 Web 服务 器 的 IP 地 址 ， 当 她 向 那个 IP 地 址 
发 送 一 个 IP 数据 报 (如 一 个 TCP SYN 报 文 段 )。 这 个 报 文 段 将 通过 因特网 进行 路 由 ， 
访问 位 于 许多 不 同 AS 中 的 一 系列 路 由 器 ， 并 最 终 到 达 你 的 Web 服务 器 ， 当 这 些 路 由 器 
中 的 任 一 个 接收 到 该 报 文 段 ， 将 去 其 转发 表 中 查找 表 项 ， 以 决定 它 转发 该 报 文 段 的 出 
口 ，、 因 此 ， 每 台 路 由 器 需要 知道 你 公司 的 /24 WA (或 某 些 聚合 项 ) 的 存在 。 一 台 路 由 
器 怎样 才能 知道 你 公司 的 前 缀 呢 ? 如 我 们 刚才 所 见 ， 它 从 BGP 知道 了 前 级 ! 特别 是 ， 
当 你 的 公司 联系 一 个 本 地 ISP 并 分 配 到 一 个 前 级 (如 一 个 地 址 范围 ) 时 ， 你 的 本 地 ISP 
将 使 用 BCP 来 向 它 连接 的 ISP 通告 该 前 级 。 那 些 ISP 则 将 依次 使 用 BOP 来 传播 该 通告 . 
最 终 ， 所 有 的 因特网 路 由 器 将 知道 你 的 前 级 (或 包括 你 的 前 缓 的 某 些 聚合 ) Arn ges 
以 你 的 Web 和 邮件 服务 器 为 目的 地 适当 地 转发 数据 报 - 


BGP 使 得 每 个 AS Ali lie AS H I 大 哪些 目的 地 ， 在 BGP 中 ， 目 的 地 不 是 主机 
而 是 CDIR 化 的 前 缀 (prefix) ， 每 个 前 组 表示 一 个 子 网 或 一 个 子 网 的 集合 。 因 此 ， 例 如 假 
定 有 4 个 子 网 与 AS2 相连 : 138. 16.64/24, 138. 16.65/24, 138. 16.66/24 和 138. 16. 67/24 
则 AS2 能 为 这 4 个 子 网 聚合 这 些 前 级 ， 并 使 用 BGP 向 ASI 通告 单一 前 组 138. 16. 64/22. 4 
男 一 个 例子 ， 假 定 这 4 个 子 网 中 的 前 3 个 在 AS2 中 ， 第 四 个 子 网 138. 16. 67/24 位 于 AS3 F. 
则 如 4.4.2 节 中 的 实践 原则 所 述 ， 因 为 路 由 副 使 用 最 长 前 缀 匹配 来 转发 数据 报 ， 所 以 AS3 jo] 
ASI 通告 更 特定 的 前 级 138. 16.67/24, ify AS2 仍然 向 ASI 通告 聚合 的 前 绥 138. 16. 64/22. 

现在 我 们 研究 一 下 BGP 是 怎样 经 显示 在 图 4-40 中 的 BGP 会 话 来 分 发 前 级 可 达 性 信息 
的 。 正 如 你 所 预想 的 那样 ， 在 网 关 路 由 器 3a 和 le 之 间 使 用 eBGP 会 话 ，AS3 回 ASI 发 送 
经 AS3 可 达 的 前 缀 列表 ; ASI 向 AS3 发 送 经 ASI 可 达 的 前 组 列表 。 类 似 地 ，AS1 和 AS2 
通过 它们 的 网 关 路 由 器 1b 和 2a 交换 其 可 达 性 信息 。 同 样 如 你 预期 的 那样 ， 在 任何 As 中 
的 网 关 路 由 器 接收 到 eBGP 学 习 到 的 前 级 后 ， 该 网 关 路 由 器 使 用 它 的 BGP 会 话 来 向 该 AS 
中 的 其 他 路 由 器 发 布 这 些 前 级 。 因 此 ， 在 AS) 中 的 所 有 路 由 器 将 得 知 AS3 的 前 级 ， 包 括 网 
关 路 由 需 1b 也 将 得 知 这 些 前 级 。 在 AST 中 的 网 关 路 由 器 1b 因此 能 同 AS2 重新 通告 AS3 的 
前 级 。 当 一 台 路 由 器 (网 关 或 不 是 网 关 ) 得 知 一 一 个 新 前 级 时 ， 它 为 该 前 级 在 其 转发 表 中 创 
建 一 个 项 ， 如 4.5.3 所 述 的 那样 。 

2. 路 径 属性 和 BGP 路 由 

在 对 BGP 有 了 一 些 基 本 了 解 后 ， 下 面 我 们 更 深入 地 学 习 它 (在 此 过 程 中 将 同时 增加 
一 些 较为 不 重要 的 技术 细节 1!)。 在 BGP 中 ,一 个 自治 系统 由 其 全 局 唯一 的 自治 系统 号 
( Autonomous System Number, ASN) [RFC 1930] 所 标识 。( 从 技术 上 讲 ， 并非 每 个 AS 都 
有 一 个 ASN。 特 殊 是 有 一 种 所 谓 桩 (stub) AS 通常 就 没有 ASN ， 这 种 桩 AS 仅 承 载 源 地 址 
或 目的 地 址 为 本 AS 的 流量 。 我 们 将 在 下 面 讨论 中 忽略 这 种 特殊 情况 ， 以 便 能 从 全 局 看 问 
题 .) 就 像 IP 地 址 一 样 ，AS 号 由 ICANN 地 区 注册 机 构 分 配 [ICANN 2012 | . 

当 一 台 路 由 器 通过 BOP 会 话 通告 一 个 前 级 时 ， 它 在 前 级 中 包括 一 些 BGP 属性 (BGP 
attribute ) 。 用 BGP 术语 来 说 ， 带 有 属性 的 前 组 被 称 为 一 条 路 由 (route), AE, BGP 对 等 
方 彼 此 通告 路 由 。 两 个 较为 重要 的 属性 是 AS- PATH 和 NEXT- HOP, 


e AS-PATH. 该 属性 包含 前缀 的 通告 已 经 通过 的 那些 AS。 当 一 个 前 级 传送 到 一 个 


AS 时 ， 该 AS 将 它 的 ASN 增加 到 AS- PATH 属性 中 。 例 如 ， 考 虑 图 4-40， (Re RTA 
138. 16. 64/24 首先 是 由 AS2 问 AST 通告 的 ; 如 末 ASI 接 下 来 将 该 前 级 向 AS3 通告 ， 
则 该 AS-PATH 将 是 AS2 AS1。 路 由 天 使 用 该 AS-PATH 属性 来 检测 和 防止 循环 通告 ; 
特别 是 如 果 一 人 台 路 由 器 看 到 它 的 AS 被 包括 在 该 路 径 列 表 中 ， 它 将 拒绝 该 通告 。 我 们 
将 很 快 讨论 到 ， 路 由 融 也 使 用 AS- PATH 属性 在 多 条 路 径 中 选择 相同 的 前 级 。 

在 AS 间 和 AS 内 部 路 由 选择 协议 之 间 提 供 重 要 链 路 后 ，NEXT- HOP 属性 具有 一 种 
微妙 而 重要 的 用 途 。NEXT- HOP 是 一 个 开始 某 AS-PATH 的 路 由 器 接口 。 为 了 深入 
理解 该 属性 ， 我 们 再 次 观察 网 4-40。 考 虑 当 AS3 中 的 网 关 路 由 天 3a I] AST 中 的 网 
关 路 由 需 lc 通告 一 条 路 由 时 发 生 的 情况 。 该 路 由 包括 通告 前 级 (我 们 称 该 前 级 为 
x) 和 针对 该 前 级 的 一 个 AS- PATH。 该 通告 也 包括 NEXT- HOP， 这 是 路 由 人 各 3c 通 
向 le 的 接口 的 了 下 地 址 。( 前面 讲 过 一 台 路 由 硕 具 有 多 个 了 下地 址 ， 每 个 接口 有 一 个 
地 址 .) 现在 考虑 当 路 由 器 1d 得 知 了 来 自 iBGP 的 这 条 路 由 后 发 生 的 情况 。 在 得 知 
到 xx 的 这 条 路 由 后 ， 路 由 震 1d 可 能 要 沿 着 该 路 由 向 x 转发 分 组 ， 即 路 由 各 1d 可 
能 要 在 其 转发 表 中 包括 表 项 (x, 1)， 其 中 1 是 从 1d 朝 着 网 关 路 由 天 lc 开始 最 低 
费用 路 径 的 接口 。 为 了 决定 1，1d 在 NEXT-HOP 属性 中 提供 了 到 它 的 AS 内 部 路 由 
选择 模块 的 IP 地址。 注意 到 AS 内 部 路 由 选择 算法 已 经 确定 了 到 ASI 中 所 有 与 该 
路 由 器 相连 的 子 网 的 最 低 费 用 路 径 ， 包 括 到 用 于 lc 和 3a 之 间 的 链 路 的 子 网 。 从 
ld 到 le -3a 子 网 的 这 条 最 低 费 用 路 径 出 发 ，1d 决定 它 的 路 由 需 接 口上 4 开始 于 这 条 
路 径 ， 进 而 将 表 项 (x, D 增加 进 它 的 转发 表 中 。 这 怠 实 现 了 这 项 功能 ! 总 而 言 
之 ， 路 由 需 使 用 NEXT- HOP 属性 正确 地 配置 它们 的 转发 表 . 

图 4-41 图 示 说 明了 另 一 种 需要 NEXT-HOP 的 情况 。 在 该 图 中 ，AS1 和 AS2 由 两 条 对 
等 链 路 连接 。 在 AST 中 的 路 由 融 能 够 知道 到 相同 前 绥 x 的 两 条 不 同 的 路 由 。 这 两 条 
路 由 具有 到 x 的 相同 的 AS-PATH ， 但 具有 不 同 的 NEXT- HOP 值 对 应 于 不 同 的 对 等 链 
路 。 使 用 NEXT- HOP 值 和 AS 内 部 路 由 选择 算法 ， 路 由 需 能 够 确定 到 每 条 对 等 链 路 
的 路 径 的 费用 ， 然 后 应 用 热土 豆 路 由 选择 (参见 4.5.3 市 ) 来 决定 适当 的 接口 。 


BGP 也 包括 允许 路 由 带 对 路 由 分 配 仿 好 测度 的 属性 ， 以 及 指示 前 级 如 何 插 入 位 于 起 始 


AS 的 BGP 的 属性 。 对 于 路 由 属性 的 全 
mit ie, ÆW | Griffin 2002; Stewart 
1999; Halabi 2000; Feamster 2004; RFC 
4217], 

当 一 台 网 关 路 由 需 接 收 到 一 从 路 由 
器 通告 时 ， 它 使 用 其 输入 策略 (import 
policy) 来 决定 是 否 接收 或 过 滤 该 路 由 ， 
是 否 设置 某 种 属性 ， 如 路 由 顺 伺 好 测度 . 
输入 策略 可 能 过 滤 掉 一 条 路 由 ， 因 为 该 
AS 可 能 不 希望 通过 在 该 路 由 的 AS-PATH 
中 的 某 个 AS 发 送 流量 。 网 关 路 由 带 也 可 
能 过 滤 一 条 路 由 ， 因 为 它 已 经 知道 了 一 
条 到 相同 前 级 的 偏好 路 由 。 





图 例 : 


图 4-41 


在 AS2 和 ASI 
之 间 的 两 条 
对 等 链 路 


路 由 器 知道 了 


* 对 目的 地 x 的 路 由 通告 


在 通告 中 用 于 确定 使 用 哪 条 对 等 
链 路 的 NEXT- HOP 属性 
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3. BGP 路 由 选择 
如 本 节 前 面 所 述 ，BGP 使 用 eBGP 和 iBGP 向 在 AS 中 的 所 有 路 由 器 发 布 路 由 。 根 据 这 
种 发 布 ， 路 由 需 可 能 知道 到 达 任 何 一 条 前 绥 的 多 条 路 由 ， 在 这 种 情况 下 路 由 融 必 须 在 可 能 
的 路 由 中 选择 一 条 。 进 入 这 个 路 由 选择 进程 的 输入 是 被 路 巾 需 知道 并 接受 的 所 有 路 由 的 集 
合 。 如 果 对 相同 前 级 存在 两 条 或 多 条 路 由 ， 则 BGP 顺序 地 调用 下 列 消 除 规 则 ， 直 到 留 下 
条 路 由 。 
。 路 由 被 指派 一 个 本 地 偏好 值 作为 它们 的 属性 之 一 。 一 条 路 由 的 本 地 仿 好 可 能 由 该 
路 由 需 设 置 或 可 能 由 在 相同 AS 中 的 另 一 台 路 由 融 学 习 到 。 这 是 一 条 由 AS 的 网 络 
管理 员 决 定 的 决策 。( 我 们 随后 将 更 为 详细 地 讨论 BGP 策略 问题 ,) 具有 最 高 本 地 
偏好 值 的 踏 由 将 被 选择 。 
e 在 余下 的 路 由 中 (所 有 都 具有 相同 的 本 地 偏好 值 )， 上 有 具有 最 短 AS- PATH 的 路 由 将 
被 选择 。 如 果 该 规则 是 路 由 选择 的 唯一 规则 的 话 ， 则 BGP 将 使 用 一 种 距离 向 量 算 
法 来 决定 路 径 ， 其 中 距离 测度 使 用 AS 跳 的 数目 而 不 是 路 由 器 跳 的 数目 。 
。 在 余下 的 路 由 中 (所 有 都 具有 相同 的 本 地 偏好 和 相同 的 AS- PATH 长 度 ) ， 将 选择 
具有 最 靠近 NEXT- HOP 路 由 器 的 路 由 。 这 里 ， 最 靠近 是 指 具 有 最 低 费 用 路 径 的 费 
用 的 路 由 器 ， 它 由 AS 内 部 算法 来 决定 。 如 在 4.5. 3 节 中 所 讨论 的 那样 ， 该 进程 经 
常 被 称 为 热土 豆 路 由 选择 。 
e 如 果 仍 留 下 多 条 路 由 ， 该 路 由 器 使 用 BGP 标识 符 来 选择 路 由 ; 参见 [Stewart 1999 | - 
消除 规则 其 至 比 上 面 描述 的 更 为 复杂 。 为 了 避免 BGP 出 现 严 重 问题 ， 少 量 地 学 习 一 
些 BGP 选择 规则 方面 的 知识 是 有 好 处 的 。 





将 它们 拼装 起 来 : 表 项 是 怎样 进入 路 由 器 的 转发 表 的 ? 


前 面 讲 过 路 由 器 转发 表 中 的 一 个 表 项 是 由 前 级 (如 138.16.64/22) 和 一 个 对 应 的 
路 由 器 输出 端口 (如 端口 7) 组 成 的 。 当 一 个 分 组 到 达 路 由 器 时 ， 该 分 组 的 目的 IP 地 址 
与 转发 表 中 的 前 级 进行 比较 ， 找到 与 最 长 前 级 匹 配 的 表 项 。 该 分 组 则 (在 本 路 由 器 中 ) 
转发 到 与 该 前 组 相关 的 端口 。 我 们 现在 总 结 一 下 一 个 路 由 选择 表 项 (前 级 和 相关 端口 ) 
是 如 何 进 入 转发 表 中 的 。 这 种 简单 的 操作 将 我 们 已 经 学 习 的 路 由 选择 和 转发 的 知识 有 机 
地 结合 了 起 来 。 为 了 使 其 有 趣 ， 我 们 假设 该 前 组 是 一 种 “外 部 前 级 ”， 即 它 不 属于 该 路 
由 器 的 AS 而 属于 某 些 其 他 AS, 
为 使 一 个 前 组 进入 路 由 器 的 转发 表 ， 路 由 器 必须 首先 知晓 该 前 缓 (对 应 于 一 个 子 网 
或 子 网 的 一 个 聚合 ) 。 如 我 们 已 经 学 习 的 那样 ， 经 过 ingen 该 路 由 器 知道 了 前 
级。 这 种 通告 可 能 (从 位 于 另 一 个 AS 中 的 一 ae) ee 话 ， 或 者 (从 
位 于 相同 AS 中 的 一 台 路 由 器 ) 经 一 个 1BGP 会 话 发 送 给 
在 路 由 器 知道 了 前 缓 之 后 ， Pe 决定 适当 
pie 端口 一 一 目的 地 指向 该 前 组 的 数据 报 将 转发 到 该 端口 。 如 果 路 由 器 接收 到 对 该 剖 
级 的 多 个 路 由 通告 ,该 路 由 器 使 用 BGP 路 由 选择 进程 ， 如 本 小 节 前 面 描述 的 那样 ， 找 
和 的 “最 好 的 ”路 由 。 假 定 这 样 一 条 最 好 的 路 由 已 选 定 。 如 前 所 述 ， 所 选择 
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的 路 由 包括 了 NEXT-HOP 属性 ， 它 是 沿 着 这 条 最 好 路 径 的 该 路 由 器 AS 之 外 的 第 一 台 路 
由 器 的 IP 地址。 如 前 所 述 ， 该 路 由 器 则 使 用 它 的 AS 内 部 路 由 选择 协议 (通常 为 OSPF) 
来 确定 通 向 NEXT-HOP 路 由 器 的 最 短路 径 。 路 由 器 最 后 通过 指出 沿 最 短路 径 的 第 一 段 
链 路 ， 确 定 端口 号 以 关联 其 前 组 。 路 由 器 则 能 够 (最终!) HAR - 端口 对 加 入 其 转发 
表 ! 由 路 由 选择 过 程 计算 (参见 图 4-6) 的 转发 表 则 被 推 入 路 由 器 的 输入 端口 线路 卡 。 


4. 路 由 选择 师 略 

我 们 用 一 个 简单 的 例子 说 明 BGP 路 由 选择 策略 的 某 些 基本 概念 。 图 4-42 显示 了 6 个 
互联 的 自治 系统 : A,B,C, W, XAY, EZRET) A, B,C, W, XAY Zé AS, 
而 不 是 路 由 器 。 假 设 自 治 系统 WW、X 和 YY 是 桩 网 络 ，A、B 和 C 是 主干 提供 商 网 络 。 我 们 
还 要 假设 A、B 和 CC 都 是 彼此 对 等 的 ， 并 向 它们 的 客户 网 络 提供 全 部 的 BGP 信息 。 所 有 进 
人 桩 网 络 (stub network) 的 流量 必定 是 去 往 该 网 络 ， 所 有 离开 桩 网 络 的 流量 必定 源 于 该 网 
络 。W 和 YY 显然 是 桩 网 络 。X 是 一 个 多 宿 桩 网 络 (multi-homed stub network ) ， 因 为 它 是 经 
由 两 个 不 同 的 提供 商 连 到 网 络 的 其 余部 分 (这 种 方法 在 实践 中 变 得 越 来 越 普 遍 )。 人 然而， 
就 像 W 和 YY 一 样 ，X 自身 必定 是 进入 /离开 X 的 所 有 流量 的 源 / 目 的 地 。 但 这 种 桩 网 络 的 
行为 是 如 何 被 实现 和 强制 实现 的 呢 ? X 如 何 防止 转发 B C 之 间 的 流量 呢 ? 这 通过 控制 
BGP 路 由 的 通告 方式 可 容易 地 实现 。 特 别 是 ，X 如 果 ORRE BAC) 通告 它 没有 通 问 
( 除 自身 以 外 ) 任何 其 他 目的 地 的 路 径 ， 那 么 它 将 起 到 一 个 桩 网 络 的 作用 。 这 就 是 说 ， 即 
使 X 可 能 知道 一 条 路 径 能 到 达 网 络 Y， 比 如 说 XCY， 它 也 不 该 条 路 径 通 告 给 B。 由 于 B 不 
知道 X 有 一 条 路 径 到 Y，B 绝 不 会 经 由 X 转发 目的 为 Y (或 C) 的 流量 。 这 个 简单 的 例子 
说 明了 如 何 使 用 一 条 选择 的 路 由 通告 策略 来 实现 客户 /提供 商 关 系 。 


图 例 : 
Es, cf 
in | ~ “提供 商 网 络 
w— A 
iis “a 客户 网 络 
— 


图 4-42 一 个 简单 的 BGP 应 用 情况 


我 们 接 下 来 关注 一 个 提供 商 网 络 ， 比 如 自治 系统 B。 假定 B 已 经 (MAA) 知道 了 A 
有 一 条 到 W 的 路 径 AW。B 因此 能 将 路 由 BAW 设置 到 其 路 由 信息 库 中 。 显 然 ，B 也 想 向 
它 的 客户 X 通告 路 径 BAW， 这 样 X 知道 它 能 够 通过 B 路 由 选择 到 WW。 但是，B 应 该 将 路 
径 BAW 通告 给 C 吗 ? 如 果 它 这 样 做 ， 则 C 可 以 经 由 CBAW 将 流量 引导 到 W, WRA, B 
和 C 都 是 主干 提供 商 ， 而 B 也 许 正好 觉得 它 不 应 该 承担 在 A 与 C 之 间 传 送 流量 的 负担 
(和 费用 !) 。B 可 能 有 理由 认为 ， 确 保 C 能 经 过 A AC 之 间 的 直接 连接 引导 A 客户 的 流量 
是 A 和 C 的 工作 (和 费用 ) 。 目 前 还 没有 强制 主干 ISP 之 间 如 何 路 由 选择 的 官方 标准 。 然 
而 ， 商 业 运行 的 ISP 们 都 遵从 的 一 个 经 验 法 则 是 : 任何 穿越 某 ISP 主干 网 的 流量 必须 是 其 
源 或 目的 (或 两 者 ) 位 于 该 ISP 的 某 个 客户 网 络 中 ; 不 然 的 话 这 些 流量 将 会 免费 搭车 通过 
该 ISP 的 网 络 。 各 个 对 等 协定 (用 于 解决 前 面 提 到 的 问题 ) 通常 都 是 ISP 双方 进行 协商 ， 
而 且 经 常 是 对 外 保密 ; [Huston 1999a] 提供 了 关于 对 等 协定 的 有 趣 讨论 。 路 由 选择 策略 如 


268 


W 
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何 反 映 ISP 之 间 的 商业 关系 的 详细 摘 述 参见 [Gao 2001; Dmitiropoulos 2007 |, M ISP 的 立 
Site, H XK BGP 路 由 选择 策略 的 讨论 参 | Caesar 

如 上 所 述 ，BGP 是 一 个 对 于 公共 因特网 的 AS 之 回路 由 选择 的 事实 上 的 标准 。 为 了 观 
察 从 第 一 层 ISP A aR (大 量 ) 提取 出 来 的 各 种 BGP 路 由 选择 表 的 内 容 ， 参 见 http: // 
www. rouleviews. org, BGP 足 由 选择 表 通 常 包 含 数 以 万 计 的 前 级 和 对 应 的 属性 。 有 关 BOP 
路 由 选择 表 的 规模 和 特征 的 统计 数据 呈现 在 [| Potaroo 2012 | . 

我 们 完成 了 对 BGP 的 简要 介绍 。 理解 BGP 是 重要 的 ， 因 为 它 在 因特网 中 起 着 重要 作 

,我 们 鼓励 你 阅读 参考 文献 | Griffin 2012; Stewart 1999; Labovitz 1997; Halabi 2000; 
Seia 1998; Gao 2001; Feamster 2004; Caesar 2005; Li 2007 | ， 以 学 习 更 多 的 BGP 知识 。 





实践 原则 


为 什么 会 有 不 同 的 AS 间 和 AS 内 部 路 由 选择 协议 ? 


学 习 了 目前 部 署 在 因特网 中 的 特定 的 AS 间 和 AS 内 部 路 由 选择 协议 ， 通 过 思考 一 
个 也 许 是 最 为 根本 性 的 问 是 会 问 的 问题 ， 来 得 到 结论 (项 
望 你 已 经 一 直 在 思考 该 问题 ， 并 且 不 致 因 技 术 细 节 而 不 能 把 握 全 局 ): 为 什么 要 使 用 不 
同 的 AS la] fo AS 内 部 路 由 选择 协议 ? 

对 该 问题 的 答案 触及 了 AS 内 与 AS 间 的 路 由 选择 目标 之 间 差 别 的 本 质 : 

e 策略 .在 AS 之 间 ， 策 略 问 题 起 主导 作用 。 一 个 给 定 AS 产生 的 流量 不 能 穿 过 另 
一 个 特定 的 AS， 这 可 能 非常 重要 。 类 似 地 ， 一 个 给 定 AS 也 许 想 控制 它 承载 的 
其 他 AS 之 间 穿 越 的 流量 .我们 已 看 到 ，BGP 承载 了 路 径 属 性 ， 并 提供 路 由 选择 
信息 的 爱 控 分 布 ， 以 便 能 做 出 这 种 基于 策略 的 路 由 选择 决策 。 在 一 个 AS 内 部 ， 
一 切 都 是 在 相同 的 管理 控制 名 义 下 进行 的 ， 因 此 策略 问题 在 AS 内 部 选择 路 中 起 
着 微不足道 的 作用 ， 

e 规模 ， 扩 展 一 个 路 由 选择 算法 及 其 数据 结构 以 处 理 到 大 量 网 络 或 大 量 网 络 之 间 
的 路 由 选择 的 这 种 能 力 ， 是 AS 间 路 由 选择 的 一 个 关键 问题 。 在 一 个 AS A, T 
扩展 性 不 是 关注 的 焦点 ， 首 先 ， 如 果 单 个 管理 域 变 得 太 大 时 ， 总 是 能 将 其 分 成 
两 个 AS， 并 在 这 两 个 新 的 AS 之 间 执 行 AS 间 路 由 选择 算法 。 (前 面 讲 过 ，OSPF 
ee 分 成 区 域 而 建立 这 样 的 层次 结构 -。) 

e 性能。 由 于 AS 间 路 由 选择 是 面向 策略 的 ， 因 此 所 用 路 由 的 质量 (如 性 能 ) 通 
常 是 次 要 关心 的 问题 ( 即 一 条 更 长 或 费用 更 高 但 能 满足 某 些 策略 条 件 的 路 由 也 
许 被 采用 了 ， 而 更 短 但 不 满足 那些 条 件 的 路 由 却 不 会 被 采用 ) 。 我 们 的 确 看 到 了 
在 AS 之 间 ， 甚 至 没有 与 路 由 相关 的 费用 (除了 AS 跳 计 数 外 ) 概念 。 然 而 在 一 
个 AS 内 部 ， 这 种 对 策略 的 关心 就 不 重要 了 ， 可 以 使 路 由 选择 更 多 地 关注 于 一 条 
路 由 实现 的 性 能 级 别 方面 。 





4.7 广播 和 多 播 路 由 选择 
到 目前 为 止 ， 本章 关注 的 是 支持 单 播 ( 即 点 对 点 ) 通信 的 路 由 选择 协议 ， 单 个 源 结 点 
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基于 这 种 协议 向 单个 目的 结 点 发 送 分 组 。 在 本 市 中 ， 我们 将 注意 力 转 向 广播 和 多 播 路 由 选 
择 协 议 。 在 广播 路 由 选择 (broadcast routing) 中 ， 网 络 层 提供 了 从 一 种 源 结 点 到 网 络 中 的 
所 有 其 他 结 点 交付 分 组 的 服务 ; 多 播 路 由 选择 (multicast routing) 使 单个 源 结 点 能 够 问 其 
他 网 络 结 点 的 一 个 子 集 发 送 分 组 的 副本 。 在 4.7.1 节 中 ， 我们 将 考虑 广播 路 由 选择 算法 和 
它们 在 路 由 选择 协议 中 的 具体 实现 。 我 们 将 在 4.7.2 市 中 人 研究 多 播 路 由 选择 。 


4.7.1 广播 路 由 选择 算法 


也 许 完 成 广播 通信 的 最 直接 的 方式 是 由 发 送 结 点 回 每 个 目的 地 分 别 发 送 分 组 的 副本 ， 
如 图 4-43a 所 示 。 在 给 定 N 个 目的 结 总 的 情况 下 ， 源 结 点 只 是 产生 该 分 组 的 N 份 副 本 ， 对 
不 同 目的 地 的 每 个 副本 进行 编 址 ， 并 用 单 播 路 由 选择 同 NV 个 目的 地 传输 这 N 份 副本 。 这 
种 用 人 次 单 播 (N-way-unicast) 实现 广播 的 方法 向 单 ， 无 需 新 的 网 络 层 路 由 选择 协议 以 及 
分 组 复制 或 转发 功能 。 然 而 ， 这 种 方法 有 几 个 缺点 。 第 一 个 缺点 是 它 的 效率 低 。 如 果 源 结 
点 经 过 单一 链 路 与 该 网 络 其 余部 分 相连 的 话 ， 该 (相同 ) 分 组 的 N 份 独立 的 副本 将 都 经 
过 该 段 链 路 传输 。 显 然 更 为 有 效 的 方式 是 ， 经 第 一 跳 仅 发 送 分 组 的 单个 副本 ， 然 后 让 第 一 
跳 后 面 其 他 端的 结 点 生成 并 转发 任何 附 
加 的 所 需 副 本 ， 这 就 是 说 ， 让 网 络 结 点 
AEA (而 不 只 是 源 结 点 ) 生成 分 组 的 元 
余 副 本 将 更 加 有 效 。 例 如 ， 在 图 4-43b 
中 ， 仅 有 分 组 的 一 个 副本 通过 R1- R2 链 
路 ,该 分 组 则 在 R2 被 复制 ， 经 链 路 
R2-R3 和 R2-R4 发 送 单个 副本 。 

N 次 单 播 的 其 他 缺点 也 许 更 为 微妙 ， 
HEKKER, N 次 单 播 的 一 个 隐 含 假设 
是 广播 的 接收 方 及 其 地 址 均 为 发 送 方 所 
类。 但 是 怎样 得 到 这 些 信息 呢 7? 最 可 能 的 是 ， 需 要 有 另外 的 协 以 机 制 〈 如 广播 成 员 或 目的 
地 注册 协议 )。 这 将 增加 更 多 的 开销 ， 并 且 重 要 的 是 为 最 初 看 起 来 相当 简单 的 协议 增加 了 
复杂 性 。A 次 单 播 的 最 后 一 个 缺点 与 使 用 广播 的 目的 有 关 。 在 4.5 节 中 ,我 们 知道 了 链 路 
状态 路 由 选择 协议 使 用 广播 来 分 发 用 于 计算 单 播 路 由 的 链 路 状态 信息 。 显 然 ， 在 使 用 广播 
来 生成 和 更 新 单 播 路 由 的 情况 下 ， 基 于 单 播 路 由 选择 基础 设施 来 取得 广播 将 〈 最 多 !) 是 
不 明智 的 。 

指出 了 NN 次 单 播 实现 广播 的 几 个 缺点 后 ， 网 络 结 点 本 身 在 分 组 复制 、 分 组 转发 和 广播 
路 由 计算 中 起 积极 作用 的 方法 ,将 显然 是 令 人 感 兴趣 的 。 下 面 我 们 将 研究 这 样 的 几 种 方 
法 ， 并 再 次 采用 在 4.5 节 中 引入 的 图 标记 法 。 我 们 再 次 将 网 络 建 模 为 图 C=(N, E), 其 
中 N 是 结 点 的 集合 , 丈 是 边 的 集合 ， 其 中 每 条 边 是 来 自 的 一 对 结 点 。 当 不 致 混 清 时 ， 使 
HN 表示 结 点 的 集合 以 及 表示 该 集合 的 基数 (IN|) 或 长 度 ， 虽然 这 种 标记 法 有 点 不 够 
严谨 。 

1. 无 控制 湛 沁 

实现 广播 的 最 显而易见 的 技术 是 洪 泛 (flooding) 方法 ， 该 方法 要 求 源 结 点 向 它 的 所 
有 邻居 发 送 分 组 的 副本 。 当 某 结 点 接收 了 一 个 广播 分 组 时 ， 它 复制 该 分 组 并 向 它 的 所 有 邻 


复制 产生 /传输 





图 4-43 源 复 制 与 网 络 中 复制 的 比较 





居 【( 除 了 从 其 接收 该 分 组 的 那个 邻居 ) 转发 之 。 显 然 ， 如 果 图 是 相连 的 ， 这 种 方案 将 最 终 
将 广播 分 组 的 副本 交付 给 该 图 中 的 所 有 结 点 。 虽 然 这 种 方案 简单 而 优雅 ， 但 它 上 只 有 致命 缺 
点 〈 在 你 继续 阅读 前 ， 看 看 你 能 否 猜 出 这 个 致命 缺点 ) : 如 果 该 图 具有 轿 ， 则 每 个 广播 分 
组 的 一 个 或 多 个 分 组 副本 将 无 体 无 止 地 循环 。 例如， 在 图 4-44 中 ，R2 将 洪 记 到 R3 R3 
将 洪 泛 到 R4，R4 将 洪 泛 到 R2，R2 将 (FRX) 洪 泛 到 R3， 等 等 。 这 种 简单 情况 导致 两 个 
广播 分 组 无 休止 地 循环 ， 一 个 朝 顺 时 针 方 向 ， 一 个 绷 逆 时 针 方 回 。 但 还 可 能 存在 着 一 种 更 
为 不 笠 的 致命 缺陷: 当 一 个 结 点 与 两 个 以 上 其 他 结 点 连接 时 ， 它 将 生成 并 转发 广播 分 组 的 
多 个 副本 ， 这 些 副本 中 的 每 个 又 产生 多 个 它们 自 喘 的 副本 (在 有 两 个 以 上 邻 拓 的 其 他 结 点 
处 )， 等 等 。 这 种 广播 风暴 (broadcast storm) 导致 无 休止 的 广播 分 组 的 复制 ， 将 最 终 导 致 
在 该 网 络 中 生成 大 量 的 广播 分 组 ， 使 得 网 络 变 得 毫 无 用 处 。 (参见 本 章 课 后 作业 中 分 析 这 
种 广播 风 和 又 增长 速率 的 问题 。) 

2. ZUZ 

WAS EEKE E EP Sa ae PE fy IE oP, FAREA Aan, 
如 果 它 已 经 接收 并 洪 泛 了 某 分 组 的 较 早 副本 ) 。 在 实践 中 ， 这 能 够 以 几 种 方式 来 实现 。 

在 序号 控制 洪 泛 (sequence-number-controlled flooding) 中 ， 源 结 点 将 其 地 址 (或 其 他 
唯一 的 标识 符 ) 以 及 广播 序号 (broadcast sequence number) 放 人 广播 分 组 ， 冉 回 它 的 所 有 
邻居 发 送 该 分 组 。 每 个 结 点 维护 它 已 经 收 到 的 、 复 制 的 和 转发 的 源 地 址 和 每 个 广播 分 组 的 
序号 列表 。 当 结 点 接收 到 一 个 广播 分 组 时 ， 它 首先 检查 该 分 组 是 否 在 列表 中 。 如 果 在 ， 于 
弃 该 分 组 ; 如 果 不 在 ， 复 制 该 分 组 并 回 该 结 点 的 所 有 邻居 转发 〈 除 了 接收 到 该 分 组 从 其 的 
那个 结 点 ) 。 在 第 2 章 中 讨论 的 Gnutella 协议 在 它 的 覆 善 网 络 中 对 广播 查询 使 用 了 序号 控 
MHZ (Æ Gnutella 中 ， 报 文 复制 和 转发 在 应 用 层 执行 ， 而 不 是 在 网 络 层 执行 。) 

受 控 洪 泛 的 第 二 种 方法 被 称 为 反 向 路 径 转 发 ( Reverse Path Forwarding, RPF) | Dalal 
1978], ， 有 时 也 称 为 反 向 路 径 广播 (RPB), RPF 的 基本 思想 简单 旦 优雅 。 当 一 台 路 由 器 接 
收 到 具有 给 定 源 地 址 的 广播 分 组 时 ， 仪 当 该 分 组 到 达 的 链 路 正好 是 位 于 它 自 己 的 返回 其 源 
的 最 短 单 播 路 径 上 ， 它 才 向 其 所 有 出 链 路 (除了 它 接收 分 组 的 那个 ) 传输 报 文 ; 否则 ， 路 
由 器 只 是 丢弃 人 分 组 而 不 同 任 何 它 的 出 链 路 转发 分 组 。 因 为 路 由 器 知道 它 在 这 样 一 条 链 路 
上 将 接收 或 者 已 经 接收 了 了 该 分 组 的 一 个 副本 〈 该 链 路 位 于 目 身 返回 发 送 方 最 短路 径 上 ) ， 
故 这 样 一 个 分 组 能 够 被 丢弃 。 (你 也 许 应 当 摘 清 ， 事 实 上， 如 果 发 生 了 这 样 的 情况 ， 环 路 
和 广播 风暴 将 不 会 出 现 。) 注意 到 RPF 不 使 用 单 播 ae 
路 由 选择 以 实际 将 分 组 交付 给 目的 地 ， 它 也 不 要 求 
路 申 天 知道 从 它 目 己 到 源 的 完整 最 短路 径 。RPF 仅 
需要 知道 在 它 到 发 送 方 的 单 播 最 短路 径 上 的 下 一 个 
邻居 ; 它 仅 使 用 这 个 邻居 的 有 身份 以 决定 是 否 洪 泛 一 
个 接收 到 的 广播 分 组 。 

图 4-44 举例 说 明了 RPF。 假 定 用 粗 线 画 的 链 
路 表示 了 从 接收 方 到 源 CA) 的 最 低 费 用 路 径 。 续 
点 A 最 初 广播 一 个 源 为 A 的 分 组 到 结 点 C 和 B。 结 





图 例 : 
D e a | en 分 组 将 被 转发 
点 B 将 同 结 点 C 和 D 转发 它 从 结 点 A 接收 到 的 源 “一 < 分 组 不 被 接收 的 路 由 器 转发 


为 A 的 分 组 (因为 A 位 于 到 A 的 最 低 费 用 路 径 图 4- 和 4 反 向 路 径 转发 
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上 )。B 将 忽略 (丢弃 而 不 转发 ) 从 任何 其 他 结 点 (如 从 路 由 右 C 或 D) 接收 的 源 为 A 的 
分 组 。 我 们 现在 考虑 结 点 C，C 将 直接 从 A 以 及 从 B 接收 源 为 A 的 分 组 。 因 为 B 不 在 C 自 
CEJA 的 最 短路 径 上 ，C 将 忽略 来 自 B 的 任何 源 为 A 的 分 组 .在 男 一 方面 ， 当 C 接收 到 
直接 来 目 A 的 源 为 A 的 分 组 ， 它 将 回 结 点 B、E 和 下 转发 该 分 组 . 

3. 生成 树 广播 

里 然 序号 控制 洪 泛 和 RPF 避免 了 广播 风暴 ， 但 它们 不 能 完全 避免 元 余 广播 分 组 的 传 
输 。 例如， 在 网 4-44 中 , 结 点 B、C、D、E 和 上 接收 到 一 个 或 两 个 了 元 余 分 组 。 在 理想 情 
况 下 ， 每 个 结 点 应 当 仅 接收 广播 分 组 的 一 个 副本 。 查 看 在 图 4-45a 中 由 粗 线 相 连结 点 组 成 
的 树 ， 你 能 看 到 如 果 广 播 分 组 仅 沿 着 该 树 中 的 链 路 转发 的 话 ， 所 有 网 络 结 点 的 每 个 将 恰好 
接收 到 广播 分 组 的 一 个 副本 ， 这 正 是 我 们 要 寻找 的 解决 方案 ! 该 树 是 一 棵 生成 树 span- 
ning tree) 的 例子 ， 它 包含 了 图 中 的 每 个 结 点 。 更 形式 化 地 讲 ， 图 G = (N,E) 的 一 棵 生 
成 树 是 一 个 图 G' =(N, E'), (ERE RENE, CRN, OLAS, HA CH 
括 了 在 和 中 的 所 有 初始 结 点 。 如 果 每 段 链 路 具有 相应 的 费用 且 一 棵 树 的 费用 就 是 其 链 路 费 
用 之 和 ， 则 在 该 图 的 所 有 生成 树 中 费用 最 小 的 生成 树 (上 毫 不 奇怪 地 ) 被 称 为 最 小 生成 树 


(minimum spanning tree ) , 





a) 由 A 发 起 的 广播 bD 由 D 发 起 的 广播 
图 4-45 沿 着 一 棵 生成 树 的 广播 
因此 ， 提 供 广播 的 另 一 种 方法 是 首先 对 网 络 结 点 构造 出 一 棵 生成 树 。 当 一 个 源 结 点 要 


发 送 一 个 广播 分 组 时 ， 它 回 所 有 属于 该 生成 树 的 特定 链 路 发 送 分 组 。 接 收 广播 分 组 的 结 点 
则 向 在 生成 树 中 的 所 有 邻居 转发 该 分 组 ( 其 接收 该 分 组 的 邻居 除外 )。 生 成 树 不 仅 消除 了 
元 余 的 广播 分 组 ， 而 且 一 旦 合适 ,该 生成 树 能 够 被 任何 结 点 用 于 开始 广播 分 组 ， 如 图 4-45a 
RIAL 4-45b 中 所 示 。 注 意 到 一 个 结 点 不 必 知 道 整 棵 树 ; 只 需要 知道 它 在 G 中 的 哪些 邻居 是 
生成 树 的 邻居 。 

与 生成 树 方法 相关 的 复杂 性 主要 是 生成 树 的 生成 和 维护 。 已 经 研制 出 了 若干 种 分 布 式 
生成 树 算 法 [Gallager 1983, Gartner 2003 ] 。 这 里 我 们 仅 考 虑 一 种 简单 的 算法 。 采 用 基于 
中 心 的 方法 (center-based approach) 建立 一 棵 生成 树 时 ， 要 定义 一 个 中 心 结 点 (也 称 之 为 
汇合 点 (rendezvous point) 或 核 (core) ) 。 结 点 则 回 中 心 结 点 单 播 加 入 树 (tree-join) 4R 
文 。 加 入 树 报 文 使 用 单 播 路 由 选择 朝 着 中 心 结 点 转发 ， 直 到 它 到 达 一 个 已 经 属于 生成 树 的 
结 点 或 到 达 该 中 心 。 在 任 一 种 情况 下 ， 加 入 树 报 文 经 过 的 路 径 定 义 了 发 起 加 入 树 报 文 的 边 
绿 绪 点 和 中 心 之 间 的 生成 树 分 文 。 这 个 新 分 支 能 够 认为 已 被 嫁接 到 现 有 的 生成 树 上 了 。 
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图 4-46 举例 说 明了 基于 中 心 生成 树 的 构造 过 程 。 假 定 结 点 上 被 选 作 该 树 的 中 心 。 假 
定 结 点 下 首先 加 入 树 并 回转 发 加 入 树 报 文 ， 单一 链 路 EF 成 为 初始 的 生成 树 。 然 后 结 点 
B 通过 问 下 发送 它 的 加 入 树 报 文 来 加 入 该 生成 树 。 假 定单 播 路 径 从 B 路 由 到 下 上 要 经 过 D。 
在 这 种 情况 下 ， 加 入 树 报 文 导致 路 径 BDE 被 嫁接 到 生成 树 上 。 结 点 A 接 下 来 通过 问 下 转 
发 它 的 加 入 树 报 文 来 加 入 生成 组 ”如 果 A 到 下 的 单 播 路 径 通 过 B， 则 因为 B 已 经 加 入 了 这 
棵 生成 树 ，A 的 加 入 树 报 文 到 达 B 将 导致 该 AB 链 路 立即 被 嫁接 在 生成 树 上 。 结 点 C 接 下 
来 通过 回 下 直接 转发 它 的 加 入 树 报 文 ， 加 入 了 该 生成 树 。 最 后 ， 因 为 从 G 到 下 的 单 播 路 
由 选择 必须 经 过 结 点 D， 当 G 向 EE 发送 它 的 加 入 树 报 文 时 ， 该 CD 链 路 在 结 点 D 被 嫁接 到 
该 生成 树 上 ， 





a) 生成 树 的 逐步 构造 G b) 构造 的 生成 树 G 


图 4-46 基于 中 心 构造 一 棵 生成 树 


4. 实践 中 的 广播 算法 

在 实践 中 ， 广 播 协议 被 用 于 应 用 层 和 网 络 层 。Gnutella | Gnutella 2009) 为 了 在 Cnute- 
la 对 等 方 之 间 广 播 对 内 容 的 查询 ， ne ae 其 中 ,在 Gnutella 网 络 中 的 两 个 分 
布 式 应 用 级 对 等 进程 之 间 的 一 条 链 路 实际 上 是 一 条 TOP Æ}. Gnutella 使 用 某 种 形式 的 序 
史 控 制 洪 泛 ， 其 中 使 用 了 一 个 16 FERI ERA 16 LORE AT Ca fo IR TE EPR T 
Gnutella 报 文 类 型 ) ， 以 监测 一 个 接收 到 的 广播 查询 是 否 以 前 已 经 收 到 、 复 制 和 转发 过 。 
Gnutella 也 使 用 一 个 寿命 (TTL) 字段 来 限制 转发 一 个 洪 泛 请 求 通过 的 跳 数 。 当 一 个 Gnu- 
tella 进程 接收 并 复制 一 个 请 求 时 ， 它 在 转发 请 求 之 前 减 小 TTL 字 段 。 因 此 ， 一 个 洪 泛 的 
Gnutella 请 求 将 仅 到 达 位 于 从 该 请 求 的 发 起 者 到 给 定数 量 (TTL 的 初始 值 ) 的 应 用 级 跳 数 
范围 内 的 对 每 方 。Gnutella 的 洪 泛 机 制 因 此 有 时 被 称 为 范围 受 限 的 洪 泛 。 

在 OSPF | RFC 2328; Perlman 1999 | 路 由 选择 算法 和 中 间 系 统 到 中 间 系 统 (IS-IS) 路 
由 选择 算法 [RFC 1142; Perlman 1999] 中 ， 使 用 了 一 种 序号 控制 洪 泛 来 广播 链 路 状态 通 
fy (LSA), OSPF 使 用 一 个 32 比特 序号 ， 以 及 一 个 16 比特 年 龄 (age) 字段 来 标识 LSA. 
六 面 讲 过 ， 当 到 邻居 的 链 路 费用 变化 时 ， 或 当 一 条 链 路 变化 为 通 / 断 时 ，OSPF 结 点 周期 性 
地 问 与 它 相 连 的 链 路 广播 LSA. LSA 序号 被 用 于 检测 元 余 的 LSA， 但 也 服务 于 OSPF 中 的 
二 项 重要 功能 。 使 用 洪 泛 方法 ， 源 在 时 刻 上 生成 的 一 个 LSA 的 到 达 可 能 晚 于 相同 源 在 时 
刻 上 +6 产 生 的 较 新 的 LSA。 源 结 点 使 用 的 序号 使 得 一 个 较 旧 的 LSA 能 够 区 别 于 较 新 的 
LSA。 年 龄 字段 起 到 了 类 似 于 一 个 TTL 值 的 作用 。 初 始 年 龄 字段 值 被 置 为 0， 随 着 洪 泛 到 每 
一 跳 而 被 增加 ， 并 且 当 它 位 于 一 台 路 由 兹 内 存 中 等 待 洪 泛 时 也 会 增加 。 尽 管 我 们 这 里 只 是 
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阐 要 地 描述 了 LSA 洪 泛 算法 ,但 我 们 注意 到 设计 LSA 广播 协议 是 件 技巧 性 很 强 的 事情 。 
| RFC 789; Perlman 1999| 描述 了 一 次 事故 ， 在 这 次 事故 中 ， 由 于 两 个 故障 路 由 硕 不 正确 
地 传输 LSA， 引 起 早期 版 本 的 LSA 洪 泛 算法 使 整个 ARPAnet RERE T! 


4.7.2 多 播 


我 们 在 前 面 小 节 中 已 经 看 到 了 使 用 广播 服务 ， 分 组 被 交付 给 网 络 的 所 有 结 点 。 在 本 节 
中 ， 我 们 将 注意 力 转 回 多 播 (multicast) 服务 。 使 用 这 种 服务 ， 多 播 分 组 仅 被 交付 给 网 络 
结 点 的 一 个 子 集 。 一 些 新 兴 的 网 络 应 用 要 求 将 分 组 从 一 个 或 多 个 发 送 方 交付 给 一 组 接收 
方 。 这 些 应 用 包括 批量 数据 传送 【例如 从 软件 开发 者 到 需要 升级 的 用 户 之 间 的 升级 软件 的 
传送 )、 流 式 连续 媒体 (例如 将 一 个 演讲 实况 的 音频 、 视 频 和 文本 传送 给 一 组 分 布 在 多 处 
的 演讲 参与 者 ) 、 数 据 共 享 应 用 (例如 在 多 个 分 布 的 参与 者 之 间 共 享 的 电子 公告 或 电视 会 
以 应 用 ) 、 数 据 供 给 (例如 股票 报价 )、Web 缓存 更 新 、 交 互 式 游戏 (例如 分 布 式 交互 虚 
拟 环境 或 多 方 游戏 ) 。 

在 多 播 通信 中 ， 我 们 立即 面临 两 个 问题 ， 即 怎样 标识 多 播 分 组 的 接收 方 ， 以 及 怎样 为 
发 送 到 这 些 接 收 方 的 分 组 编 址 。 在 单 播 通信 情况 下 ， 接 收 方 (目的 地 ) 的 IP 地址 承载 在 
每 个 IP 单 播 数据 报 中 并 标识 了 单个 接收 方 ; 在 广播 的 情况 下 ， 所 有 结 点 需要 接收 广播 分 
组 ， 因 此 不 需要 目的 地 址 。 但 在 多 播 情况 下 ， 我 们 目前 面 对 多 个 接收 方 。 每 个 多 播 分 组 都 
携带 所 有 接收 方 的 IP 地 址 ， 这 合理 吗 ? 虽然 这 种 方法 对 于 少量 的 接收 方 可 能 是 行 得 通 的 ， 
但 它 不 能 很 好 地 扩展 到 数 以 百 计 或 数 以 千 计 的 接收 方 场合 ; 在 数据 报 中 编 址 信息 的 量 将 充 
斥 该 分 组 中 有 效 载 荷 字 段 中 实际 可 携带 的 数据 量 。 还 需要 由 发 送 方 给 出 接收 方 的 明确 标 
识 ， 使 得 发 送 方 知道 所 有 接收 方 的 标识 与 地 址 。 我 们 很 快 就 会 看 到 ， 在 许多 场合 下 是 不 硕 
望 有 这 种 要 求 的 ，。 

由 于 这 些 原因 ， 在 因特网 体系 结构 (还 有 其 他 体系 结构 如 ATM [Black 1995]) 中 ， 
多 播 数据 报 使 用 间接 地 址 (address indirection) 来 编 址 。 这 就 是 说 ， 用 一 个 标识 来 表示 一 
组 接收 方 ， 寻 址 到 该 组 的 分 组 副本 被 交付 给 所 有 与 该 组 相关 联 的 多 播 接收 方 ， 且 该 组 使 用 
这 个 单一 标识 符 。 在 因特网 中 ， 这 种 表示 一 组 接收 方 的 单一 标识 就 是 一 个 D 类 多 播 地 址 。 
与 一 个 D 类 地 址 相关 联 的 接收 方 小 组 被 称 为 一 个 多 播 组 (multicast group ) 。 多 播 组 抽象 在 
图 4-47 中 举例 说 明 。 图 中 的 4 台 主 机 (显示 为 深 色 ) 与 多 播 组 地 址 226. 17. 30. 197 相关 
联 ， 而 且 它 们 将 接收 所 有 寻 址 到 该 多 播 地 址 的 数据 报 。 我 们 仍然 必须 应 对 的 困难 在 于 这 样 
一 个 事实 ， 每 台 主机 有 一 个 唯一 的 IP 单 播 地 址 ， 该 单 播 地 址 完全 独立 于 它 所 参与 的 多 播 
组 的 地 址 。 

里 然 多 播 组 抽象 是 简单 的 ， 但 它 给 人 们 (主机) (故意 使 用 了 双关 语 ， 英 语 中 host 有 
主机 或 主人 之 意 ) 带 来 了 一 堆 问 题 。 一 个 组 是 如 何 形成 ， 又 如 何 终 结 的 呢 ?” 如 何 选 择 组 地 
hk? 新 主机 如 何 加 入 某 个 组 (要么 作为 发 送 方 ， 要 么 作为 接收 方 )? 任何 主机 都 能 加 和 一 
个 组 ( 疝 该 组 发 送 或 从 该 组 接收 ) 或 者 组 成 员 资 格 会 受到 限制 吗 ? 如果 有 限制 ， 由 谁 限 
fl? 作为 网 络 层 协议 的 一 部 分 ， 一 个 组 成 员 知 道 其 他 组 成 员 的 标识 吗 ?” 网 络 结 点 相互 之 间 
如 何 进 行 交 互 ， 以 向 所 有 组 成 员 交 付 一 个 多 播 数 据 报 呢 ?” 对 于 因特网 ， 所 有 这 些 问题 的 答 
案 都 与 因特网 组 管理 协议 (IGMP) [RFC 3376) 有关。 所 以 ,我们 接 下 来 简要 地 考虑 
ICMP， 然 后 再 回 到 这 些 更 为 一 般 的 问题 上 来 。 
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图 例 : Sn 
ES 具有 相连 组 成 员 的 路 由 器 
ŽD 不 具有 相连 组 成 员 的 路 由 器 

图 4-47 ”多 播 组 : 寻 址 到 该 组 的 数据 报 被 交付 给 多 播 组 的 所 有 成 员 


1. 因特网 组 管理 协议 

IGMP 版 本 3 | RFC 3376] 运行 在 一 台 主 机 与 其 直接 相连 的 路 由 带 之 间 (不 严格 地 说 ， 
我 们 可 将 直接 相连 的 路 由 问 看 作 第 一 跳 路 由 磊 ， 即 主机 看 到 的 在 它 自 己 本 地 网 络 外 部 的 到 
任何 其 他 主机 的 一 条 路 径 ， 或 到 该 主机 的 任何 路 径 上 的 最 后 一 跳 路 由 需 ) ， 这 种 情况 如 
图 4-48 所 示 。 网 4-48 显示 了 3 台 第 一 跳 多 播 路 由 问 ， 每 一 人 台 都 还 过 一 个 回 外 的 本 地 接口 
与 相连 的 主机 连接 。 在 该 例 中 ,， 本 地 接口 连 到 一 个 LAN E, HEA LAN 都 有 多 人 台 相 连 的 
主机 ， 在 任意 给 定时 间 内 至 多 有 几 台 主机 属于 一 个 给 定 的 多 播 组 。 





图 4-48 ”因特网 中 网 络 层 多 播 的 两 个 组 件 : IGMP 与 多 播 路 由 选择 协议 


IGMP 为 一 台 主 机 提供 了 手段 ， 让 它 通 知 与 其 相连 的 路 由 豆 : 在 本 主机 上 运行 的 一 个 
应 用 程序 想 加 入 一 个 特定 的 多 播 组 。 由 于 IGMP 的 交互 范围 被 局 限 在 主机 与 其 相连 的 路 由 
典 之 间 ， 显 然 需要 另 一 种 协议 来 协调 遍及 因特网 内 的 多 播 路 由 需 (包括 相连 的 路 由 需 ) ， 
以 使 多 播 数 据 报 能 路 由 到 其 最 终 目 的 地 。 后 一 个 功能 是 由 网 络 层 多 播 路 由 选择 算法 完成 
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的 ,我们 将 很 快 考虑 这 些 算法 。 因 此 因特网 中 的 网 络 层 多 播 是 由 两 个 互补 的 组 件 组 成 的 : 
IGMP 与 多 播 路 由 选择 协 以 。 

IGMP 只 有 三 种 报 文 类 型 。 与 ICMP 类 似 ，IGMP 报 文 也 是 承载 (HRR) 在 一 个 IP 数 
据 报 中 ， 使 用 的 他 协议 号 为 2， 由 一 台 路 由 带 问 有 所 有 与 主机 (如 局 域 网 上 的 所 有 主机 ) +H 
连 的 接口 (例如 在 一 个 局 域 网 上 对 所 有 主机 ) 发 送 一 个 membership_query 报 文 ， 以 确定 该 
接口 上 主机 已 加 入 的 所 有 多 播 组 集合 。 主 机 用 一 个 membership_report 报 文 来 响应 member- 
ship_query 报 文 。 当 一 个 应 用 程序 首次 加 入 一 个 多 播 组 时 ， 也 可 由 主机 产生 membership_ 
report 报 文 ， 而 不 用 等 竺 来 目 路 由 希 的 membership_dquery 报 文 。 最 后 一 种 IGMP 报 文 类 型 是 
leave_group 报 文 。 有 趣 的 是 ， 这 种 报 文 是 可 选 的 ! 但 如 有 果 它 是 可 选 鸭 ， 那 么 一 台 路 由 规 如 
何 检测 出 一 台 主 机 是 何 时 离开 该 多 播 组 的 呢 ? 问题 的 答案 就 在 于 使 用 了 membership_query 
RWL: 当 无 主机 啊 应 一 个 具有 给 定 组 地 址 的 membership_query (XAF, AEK h rti er ih E 
没有 主机 在 这 个 多 播 组 了 .这 是 因特网 协议 中 有 时 被 称 为 软 状态 (soft state) 机 制 的 一 个 例 
子 。 在 一 个 软 状态 协议 中 ， 状 态 (在 IGMP 场合 中 ， 有 主机 加 入 某 给 定 多 播 组 的 事实 ) 如 采 
未 被 显 式 地 更 新 (在 本 例 中 ， 由 来 自 一 相连 主机 的 membership_report 报 文 更 新 ) ， 则 通过 超 
时 事件 (EAS BI OR A A aR AY JAS) PEAY membership_query 报 文 ) 被 删除 。 

软 状 态 一 词 由 Clark | Clark 1988 | 所 创造 ，Clark fk T HA im AA Be Ac HK BY ee] 0] HE 
状态 更 新 报 文 的 概念 ， 并 且 建 议 使 用 这 样 的 更 新 报 文 ， 状 态 能 够 在 一 次 月 溃 中 丢失 ， 接 着 
自动 地 由 后 继 的 更 新 报 文 所 恢复 ， 即 对 该 端 系统 来 说 所 有 都 是 透明 的 ， 并 且 不 必 调 用 任何 
显 式 的 朋 沉 恢复 过 程 : 

“.….… 状 态 信 息 对 于 维护 与 流 相关 联 的 所 希望 类 型 的 服务 将 不 是 至 关 重 要 的 。 

相反 ， 服 务 类 型 将 由 端点 强制 执行 ， 端 点 将 周期 性 地 发 送 报 文 以 确保 适当 类 型 的 

服务 与 该 流 相 关联 。 以 这 种 方式 ， 与 该 流 关 联 的 状态 信息 可 能 在 前 溃 中 丢失 ， 但 

不 会 永久 地 破坏 所 使 用 的 服务 特色 。 我 将 这 种 概念 称 作 “ 软 状 态 ”， 它 能 非 第 好 

地 使 我 们 取得 生存 性 和 灵活 性 的 基本 目标 ……” 

人 们 已 争论 过 软 状 态 协 议 要 比 硬 状态 协 
议 的 控制 简单 一 些 ， 后 者 不 仅 要 求 状态 显 式 
地 增加 或 删除 ， 还 要 求 有 机 制 能 够 负责 当 实 
体 提 早 结束 或 失败 时 清除 状态 。 有 关 软 状态 
的 有 趣 讨 论 可 在 | Raman 1999; Ji 2003; 
Lui 2004] 中 找到 。 

2. 多 播 路 由 选择 算法 

图 4-49 中 举例 说 明了 多 播 路 由 选择 问 
题 (multicast routing problem), 。 加 入 该 多 播 
组 的 主机 着 深 色 ， 与 其 直接 相连 的 路 由 需 也 
着 深 色 。 如 图 4-49 中 所 示 ， 只 有 一 部 分 路 
由 带 〈 那 些 具 有 加 入 该 多 播 组 的 相连 主机 的 
Pear) 实际 需要 接收 多 播 流量 。 FER 4-49 | ee 
H, RAR HRA BL EAP REE = Se 








: Sas Ce 
多 播 流量 。 因 为 与 路 由 硕 D 相连 的 主机 中 没 图 4-49 多 播 主机 、 与 其 相连 的 路 由 器 


有 一 个 加 入 了 该 多 播 组 ， 且 路 由 天 C 无 相连 及 其 他 路 由 器 
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主机 ， 所 以 C ALD ABA GE EFEX Ae HR ZA iat at, ILA Be HR PEPE H tas EA AC BR E 
PAAR, rx He BE ee Ee T MARAI FAZ HY PE EUL tit. Tie Ziea EL HE 
够 沿 着 这 棵 树 从 发 送 方 路 由 到 所 有 属于 该 多 播 树 的 主机 。 当然 ， 该 树 也 许 会 包含 一 些 没有 
属于 该 多 播 组 的 相连 主机 的 路 由 器 (例如 在 图 4-49 中 ， 若 不 包含 路 由 器 C 或 D， 则 不 可 
能 连接 路 由 器 A、B、E AIF). 
在 实践 中 ， 采 用 两 种 方法 来 确定 多 播 路 由 选择 树 ， 我 们 已 经 在 广播 路 由 选择 的 内 容 中 学 
习 了 这 两 种 方法 ， 因 此 这 里 只 是 顺便 提 一 下 它们 。 这 两 种 方法 的 区 别 在 于 : 是 用 单一 的 组 共享 
树 来 为 组 中 的 所 有 发 送 方 分 发 流量 ， 还 是 为 每 个 独立 的 发 送 方 构建 一 棵 特定 源 的 路 由 选择 树 ， 
o 使 用 一 棵 组 共享 树 的 多 播 路 由 选择 。 如 同 在 生成 树 广播 的 场合 中 ， 通 过 组 共享 树 
进行 多 播 路 由 选择 的 基础 是 构建 一 棵 树 ， 该 树 包 括 了 所 有 有 具有 属于 该 多 播 组 的 相 
连 主机 的 边缘 路 由 器 。 在 实践 中 ， 使 用 基于 中 心 的 方法 来 构造 多 播 路 由 选择 树 ， 
具有 属于 多 播 组 的 相连 主机 的 边缘 路 由 需 回 中 心 结 点 〈 经 单 播 ) 发 送 加 入 报 文 . 
如 同 在 广播 情况 下 ， 一 个 加 入 报 文 使 用 单 播 路 由 选择 瑚 着 中 心 转发 ， 直 到 它 到 达 
已 经 属于 多 播 树 的 一 台 路 由 器 或 到 达 该 中 心 。 沿 着 该 加 入 报 文 走 过 路 径 的 所 有 路 
由 吉 ， 则 将 回 发 起 该 多 播 加 入 的 边缘 路 由 需 转 发 接收 到 的 多 播 分 组 .使 用 基于 中 
心 的 树 进 行 多 播 路 由 选择 ， 一 个 关键 问题 就 是 选择 树 中 心 的 过 程 -: 中心 选择 算法 
在 [Wall 1980; Thaler 1997; Estrin 1997] 中 进行 了 讨论 
e 使 用 一 棵 基于 源 的 树 的 多 播 路 由 选择 . 组 共享 树 多 播 路 由 选择 构建 单一 的 、 共 享 的 
路 由 选择 树 ， 以 路 由 所 有 发 送 方 的 分 组 ， 而 第 二 种 方法 为 多 播 组 中 的 每 个 源 构建 一 
棵 多 播 路 由 选 拼 树 。 在 实践 中 ， 使 用 RPF 算法 (具有 源 结 点 x) 来 构造 一 棵 多 播 转 
发 树 ， 以 用 于 源 于 源 点 x 的 多 播 数 据 报 。 我们 前 面 学 习 的 RPF 算法 在 用 于 多 播 环境 
中 时 要 求 有 些 不 同 。 为 了 理解 其 中 的 原因 ， 考 虑 在 图 4-S0 中 的 路 由 此 D, 在 广播 
RPF 情况 下 ， 它 将 回路 由 器 G 转发 分 7 S: 尖 a 
组 ， 即 使 路 由 器 G 没有 加 入 该 多 播 组 F. 
的 相连 主机 。 对 于 D 只 有 一 个 下 游 路 
Hak G 的 情况 来 说 ， 这 还 不 算 太 坏 ， 
想象 一 下 ， 知 有 上 千 台 路 由 豆 在 D 下 
游 时 会 出 现 什 么 情况 ! 这 数 干 台 路 由 
需 中 的 每 一 个 都 将 收 到 不 想 要 的 多 播 
分 组 。 (这 种 情景 并 不 像 看 起 来 那么 想 
当然 ,最初 全 球 第 一 个 多 播 网 络 MBone 
| Casner 1992; Macedonia 1994 | 就 经 历 
了 这 样 的 问题 .) 解决 应 用 RPF 时 会 收 
到 不 想 要 的 多 播 分 组 这 个 问题 的 方法 称 
为 剪 枝 (pruning), 一 人 台 接 收 到 多 播 分 
组 的 多 播 路 由 器 ， 如 它 无 加 入 该 组 的 相 
连 主 机 ， 则 它 向 其 上 游 路 由 带 发 送 一 个 图例 | 
RHC. WR—-ARHAMERT Fe 将 被 转发 的 分 组 
游 路 由 器 收 到 剪 枝 报 文 ， 则 它 就 能 向 上 一 被 路 由 器 接收 而 不 被 转发 的 分 组 
游 转 发 一 个 前 枝 报 文 。 图 4-50 在 多 播 情况 下 的 反问 路 径 转 发 











3， 在 因特网 中 的 多 播 路 由 选择 

第 一 个 用 于 因特网 中 的 多 播 路 由 选择 协议 是 距离 向 量 多 播 路 由 选择 协议 (Distance 
Vector Multicast Routing Protocol ，DVMRP)| RFC 1075], DVMRP 实现 了 县 有 反问 踏 径 转发 
与 剪 梳 算 法 的 基于 源 的 树 。DVMRP 使 用 一 种 前 面 描 述 的 具有 前 校 的 REP 算法 。 也 许 使 用 
最 为 广泛 的 因特网 多 播 路 由 选择 协议 是 协议 无 关 的 多 播 (Protocol Independent Multicast, 
PIM ) 路 由 选择 协议 ,该 协议 明确 辨识 两 种 多 播 分 发 情形 。 在 稠密 模式 (dense mode ) | RFC 
3973] 中 ， 多 播 组 的 成 员 位置 分 布 稠密 ; 这 束 是 说 ， 在 该 区 域内 的 许多 或 大 多 数 路 由 种 击 
要 参与 到 多 播 数据 报 路 由 选择 过 程 之 中 。PIM 稠密 模式 是 一 种 洪 沁 与 剪 核 反 问 路 径 和 转发 拉 
术 ， 类 似 于 DYMRP 的 思想 。 

(ERK (sparse mode) [ RFC 4601] 中 ， 具 有 相连 组 成 员 的 路 由 需 数 量 相对 于 路 
由 器 总 数 来 说 很 少 ， 组 成 员 极 为 分 散 。PIM MARRE AR Se OR EEA TR aT AO. ER 
特定 多 播 ( Source- Specific Multicast, SSM ) | RFC 3569; RFC 4607] 中 ， 仅 允许 单一 发 送 
方 问 多 播 树 中 发 送 流量 ， 大 大 向 化 了 树 的 构造 和 维护 。 

当 PIM 和 DVMRP 用 于 一 个 域 中 时 ， 网 络 操作 者 能 够 配置 该 域 中 的 IP dea at. Ae 
置 的 方法 与 在 域内 配置 单 播 路 由 选择 协议 如 RIP、IS-IS 和 OSPF 的 方法 非常 类 似 。 而 当 在 
不 同 域 间 需 要 多 播 路 由 时 ， 将 会 发 生 什 么 情况 呢 7 有 一 个 与 域 间 BGP 等 价 的 多 播 协 议 吗 ? 
答案 是 (从 文献 角度 讲 ) 肯定 的 。 [RFC 4271] 定义 了 对 BOP 的 多 协议 扩展 ， 使 得 BGP 
能 够 为 其 他 协议 承载 路 由 选择 信息 ， 包 括 多 播 信 息 : 使 用 多 播 源 发 现 协 以 〈Multicast 
Source Discovery Protocol, MSDP)! RFC 3618; RFC 4611) 能 够 将 不 同 的 PIM 稀疏 模式 域 中 的 
聚集 点 连接 在 一 起 ， 有 关 因 特 网 中 多 播 路 由 选择 的 当前 状态 的 极 好 概述 见 | RFC 5110 | 

下 面 通过 指出 至 今 IP 多 播 还 没有 得 到 大 规模 应 用 这 样 一 个 事实 来 结束 我 们 对 多 播 的 
讨论 。 有 关 当 前 因特网 多 播 服务 模式 和 部 署 问题 的 有 趣 讨 论 参 见 | Diot 2000; Sharma 
2003]. 无 论 如 何 ， 尽 管 网 络 级 多 播 还 没有 得 到 广泛 部 署 ， 但 它 远 没有 “ 寿 终 正 狠 ”"。 多 
年 来 在 Internet 2 上 一 直 在 承载 多 播 流 量 ， 并 且 许 多 网 络 借助 于 Internet 2 进行 相互 对 等 
[ Internet2 Multicast 2012 | 。 在 英国 ，BBC 正在 参与 经 IP 多 播 分 发 内 容 的 试验 [BBC Multi- 
cast 2012 ] 。 与 此 同时 ， 如 我 们 在 第 2 章 中 看 到 的 PPLive 以 及 在 其 他 对 等 方 到 对 等 方 系统 
如 End System Multicast] Chu 2002] 中 那样 ， 应 用 层 多 播 使 用 应 用 层 (而 不 是 网 络 层 ) 协 
汉 在 对 等 方 之 间 提 供 了 内 容 的 多 播 分 发 。 未 来 的 多 播 服务 主要 是 在 网 络 层 〈 在 网 络 核心 
中 ) 实现 ， 还 是 在 应 用 层 〈 在 网 络 的 边缘 ) 实现 呢 ? 虽然 当前 经 对 等 方 到 对 等 方 方 法 分 
发 内 容 的 针 热 暗示 着 至 少 在 近期 天 平 是 回应 用 层 多 播 倾 笠 的 ， 但 是 IP 多 播 将 继续 取得 进 
展 ， 总 有 一 天 前 进 的 步伐 最 终 会 放 慢 并 稳定 下 来 : 


4.8 小 结 


在 本 章 中 ， 我 们 开始 了 进入 网 络 核心 部 分 的 旅程 。 我 们 知道 网 络 层 涉及 网 络 中 的 每 台 
主机 与 路 由 器 。 正 因 如 此 ， 网 络 层 协议 在 协议 栈 中 是 最 具 挑 战 性 的 。 

我 们 学 习 了 路 由 右 可 能 需要 在 同一 时 刻 处 理 不 同 源 和 目的 对 之 间 的 数 以 百 万 计 的 分 组 
流 。 为 了 使 得 一 台 路 由 器 能 够 处 理 如 此 大 量 的 流 ， 网 络 设 计 者 多 年 前 就 认识 到 ， 路 由 器 的 
任务 应 当 尽 可 能 地 简单 。 为 了 使 路 由 器 的 工作 更 容易 ， 能 够 采取 许多 措施 ， 包 括 使 用 数据 
报 网 络 层 而 不 使 用 虚 电 路 网 络 层 ， 使 用 一 种 流水 线 和 固定 长 度 的 首部 (如 在 IPv6 中 所 做 


278 PAE 


的 那样 ) ， 取 消 分 片 (也 如 IPv6 中 所 做 的 那样 ) 和 提供 唯一 的 尽力 而 为 服务 。 也 许 这 里 最 
重要 的 技巧 是 : 不 要 跟踪 各 个 流 ， 而 是 使 路 由 选择 决策 只 依赖 于 数据 报 中 的 层次 结构 化 的 
目的 地 址 。 有 趣 的 是 注意 到 邮政 服务 已 经 使 用 这 种 方法 很 多 年 了 。 

在 本 章 中 ， 我 们 还 审视 了 路 由 选择 算法 的 基本 原理 。 我 们 学 习 了 路 由 选择 算法 如 何 把 
计算 机 网 络 抽象 为 一 个 具有 结 点 和 链 路 的 图 。 有 了 这 种 抽象 ， 我 们 能 够 利用 图 中 的 丰富 的 
最 短路 径路 由 选择 理论 ， 该 理论 在 过 去 40 年 中 在 运筹 学 研究 和 算法 界 得 到 了 发 展 。 我 们 
看 到 有 两 大 类 方法 : 一 种 是 集中 式 (全 局 ) 方法 ， 在 这 种 方法 中 ， 每 个 结 点 得 到 网 络 的 一 
AAA 另 一 种 是 分 布 式 方法 ， 在 这 种 方 

法 中 ， 各 结 点 只 有 整个 网 络 的 部 分 知识 ， 且 结 点 在 一 起 工作 以 便 沿 最 短路 径 交 付 分 组 。 我 
们 还 学 习 了 如 何 使 用 层次 结构 来 处 理 规模 问题 ， 通 过 将 大 型 网 络 划 分 成 称 为 目 治 系统 
(AS) 的 独立 管理 域 来 解决 。 每 个 AS 独立 地 为 其 数据 报 选择 路 由 以 通过 本 AS， 就 像 各 个 
国家 独立 地 在 本 国内 指定 邮件 传递 路 线 。 我 们 学 习 了 集中 式 、 分 散 式 和 等 级 制 方法 是 怎样 
Rt ha engke na dle 这 些 协议 是 RIP, OSPF 和 BGP. 通过 考 

广播 和 多 播 路 由 选择 ， 我 们 结束 了 路 由 选择 算法 的 学 习 。 

完成 了 对 网 络 层 的 学 习 任 务 之 后 ， 我 们 的 旅行 将 沿 协议 栈 进一步 问 下 ， 即 到 达 链 路 层 
了 。 就 像 网 络 层 一 样 ， 链 路 层 也 是 网 络 核心 的 一 部 分 。 不 过 我 们 将 在 下 一 章 看 到 ， 链 路 层 
在 同一 链 路 或 LAN 的 结 点 之 间 具 有 更 多 的 搬移 分 组 的 局 部 任务 。 昌 然 与 网 络 层 任务 比 起 
来 这 种 任务 从 表面 上 看 似 于 是 微不足道 ， 但 我 们 将 看 到 链 路 层 涉及 许多 重要 而 引人入胜 的 
问题 ， 这 些 问 题 足 够 我 们 学 习 一 段 时 间 的 了 。 


课 后 习题 和 问题 





4.1~4.2% 

RI. 我 们 回顾 一 下 在 本 书 中 使 用 的 某 些 术语 。 前 面 讲 过 运输 层 的 分 组 名 字 是 报 文 段 ， 数 据 链 路 层 的 分 组 
名 字 是 帧 。 网 络 层 分 组 的 名 字 是 什么 ? 前面 讲 过 路 由 融和 链 路 层 交 换 机 都 被 称 为 分 组 交换 机 。 路 由 
器 与 链 路 层 交 换 机 间 的 根本 区 别 是 什么 ”回想 我 们 对 数据 报 网 络 和 虚 电路 网 络 都 使 用 间 汇 路 由 器 。 

R2. 在 数据 报 网 络 中 ， 网 络 层 的 两 个 最 重要 功能 是 什么 ?” 虚 电路 网 络 中 网 络 层 的 3 个 最 重要 的 功能 是 什么 ? 

R3. 路 由 选择 和 转发 的 区 别 是 什么 

R4. 在 数据 报 网 络 和 虚 电 路 网 络 中 的 路 由 需 都 使 用 转发 表 吗 ? 如 果 是 ， 摘 述 用 于 这 两 类 网 络 的 转发 表 . 

R5. 描述 网 络 层 能 为 单个 分 组 提供 的 某 些 假想 的 服务 。 对 分 组 流 进行 相同 的 描述 。 因 特 网 的 网 络 层 为 你 
提供 了 这 些 假想 服务 吗 ?”ATM 的 CBR 服务 模型 提供 了 这 些 假想 服务 吗 ?ATM 的 ABR 服务 模型 提供 
了 这 些 假想 服务 吗 ? 

R6. 列 出 某 些 得 益 于 ATM 的 CBR 服务 模型 的 应 用 ， 

4.37 

R7. 讨论 为 什么 在 高 速 路 由 圳 的 每 个 输入 端口 都 存储 转发 表 的 影子 副本 。 

R8. 在 4.3 节 中 讨论 了 3 类 交换 结构 。 列 出 并 简要 讨论 每 一 类 交换 结构 。 哪 一 种 ( 如 果 有 的 话 ) HE 
越 交 换 绪 构 并 行 发 送 多 个 分 组 ? 

R9. 描述 在 输入 端口 会 出 现 分 组 丢失 的 原因 ,。 描述 在 输入 端口 如 何 消除 分 组 丢失 (不 使 用 无 限 大 缓存 区 ) 。 

R10. 描述 在 输出 端口 出 现 分 组 丢失 的 原因 。 通 过 增加 交换 结构 速率 ， 能 够 防止 这 种 丢失 吗 ? 

R11. 什么 是 HOL 阻塞 ” 它 出 现在 输入 端口 还 是 输出 交口 ? 
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i 
4.44 
R12. 路 由 器 有 IP 地址 吗 ” 如 果 有 ， 有 多少 个 ? 
R13. IP 地 址 223. 1. 3. 27 的 32 比特 二 进 制 等 价 形式 是 什么 ? 
R14. 考察 使 用 DHCP 的 主机 ， 获 得 它 的 IP 地 址 、 网 络 掩 公 、 默 认 路 由 融和 其 本 地 DNS IRS AF AY IP He 


R15. 


R16. 


R17. 


R18. 


R19, 
R20. 


址 。 列 出 这 些 值 。 

假设 在 一 个 源 主机 和 一 个 目的 主机 之 间 有 3 台 路 由 占 。 不 考虑 分 片 ， 一 个 从 源 主 机 发 送 给 目的 主机 
的 IP 报 文 将 通过 多 少 个 接口 ? 为 了 将 数据 报 从 源 移 动 到 目的 地 需要 检索 多 少 个 转发 表 ? 

假设 某 应 用 每 20ms 生成 一 个 40 字 节 的 数据 块 ， 每 块 封装 在 一 个 TCP 报 文 段 中 ，TCP 报 文 段 再 封装 
在 一 个 IP 数据 报 中 。 每 个 数据 报 的 开销 有 多 大 ”应 用 数据 所 占 百 分 比 是 多 少 ? 

假定 主机 A 向 主机 B 发 送 封装 在 一 个 IP 数据 报 中 的 TCP 报 文 段 。 当 主机 B 接收 到 该 数据 报时 ， 主 
HLB 中 的 网 络 层 怎 样 知道 它 应 当 将 该 报 文 段 ( 即 数据 报 的 有 效 载 集 ) 交 给 TCP 而 不 是 UDP 或 某 个 
其 他 东西 呢 ? 

假定 你 购买 了 一 个 无 线路 由 器 并 将 其 与 电缆 调制 解 调 器 相连 。 同 时 假定 ISP 动态 地 为 你 连接 的 设备 
( 即 你 的 无 线路 由 器 ) 分 配 一 个 P 地 址 。 还 假定 你 家 有 5 台 PC， 均 使 用 802. 11 以 无 线 方式 与 该 无 
线路 由 器 相连 。 怎 样 为 这 5 A PC 分 配 IP 地 址 ?该 无 线路 由 器 使 用 NAT 吗 ” 为 什么 ? 

比较 并 对 照 IPv4 和 IPv6 首部 字段 .它们 有 某 些 字段 是 相同 的 吗 ? 

有 人 说 当 IPv6 建 隧道 通过 IPv4 路 由 器 时 ，IPv6 将 IPv4 隧道 作为 链 路 层 协议 。 你 同意 这 种 说 法 吗 ? 
为 什么 ? 


4.5% 


R21. 
R22. 
R23. 


比较 和 对 照 链 路 状态 和 距离 向 量 路 由 选择 算法 ， 
讨论 因特网 的 等 级 制 组 织 是 怎样 使 得 其 能 够 扩展 为 数 以 百 万 计 用 户 的 。 
每 个 自治 系统 使 用 相同 的 AS 内 部 路 由 选择 算法 是 必要 的 吗 ? 为什么? 


467 


R24. 


R31. 


考虑 图 4-37。 从 D 中 的 初始 表 开 始 ， 假 设 D 收 到 来 日 A 的 以 下 通告 : 


目的 子 网 下 一 台 路 由 器 到 目的 地 的 跳 数 
z C 10 
w — l 
x — ] 


seeme ee lll 


D 中 的 表 将 会 改变 吗 ? 如果 是 ， 应 怎样 变化 ? 
比较 并 对 照 RIP 与 OSPF 使 用 的 通告 。 
ties. RIP 通告 通常 宣称 到 各 目的 地 的 跳 数 ， 而 BGP 更 新 却 宣称 到 各 目的 地 的 


. 为 什么 在 因特网 中 用 到 了 不 同类 型 的 AS 间 与 AS 内 协议 ? 
. 为 什么 策略 考虑 对 于 AS 内 部 协议 (如 OSPF 和 RIP)， 与 对 于 AS 间 路 由 选择 协议 (如 BGP) 一 样 


ee? 


. 定义 和 对 比 下 列 术语 : FA, WA BGP 路由， 
.BGP 是 怎样 使 用 NEXT- HOP 属性 的 ?” 它 是 怎样 使 用 AS-PATH 属性 的 ? 


描述 一 个 较 高 层 ISP 的 网 络 管理 员 在 配置 BGP 时 是 如 何 实 现 策 略 的 。 
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R32. 通过 多 个 单 播 实现 广播 抽象 与 通过 支持 广播 的 单个 网 络 (路 由 器 ) 实现 广播 抽象 之 间 有 什么 重要 区 别 ? 


R33. 


对 于 我 们 学 习 的 广播 通信 的 3 种 一 般 方法 〈 无 控制 洪 泛 、 受 控 洪 泛 和 生成 树 广播 ) 中 的 每 种 ， 下 列 说 
法 是 正确 的 吗 ? 你 可 以 假定 分 组 不 会 因 缓 存 滋 出 而 丢失 ， 所 有 分 组 以 它们 发 送 的 顺序 交付 给 链 路 。 


a 一 个 结 点 可 能 接收 到 同一 个 分 组 的 多 个 副本 。 


b. 一 个 结 点 可 能 通过 相同 的 出 链 路 转发 多 个 分 组 的 副本 。 





R34. 当 一 台 主 机 加 入 一 个 多 播 组 时 ， 它 必须 将 其 IP 地址 改变 为 它 了 所 加 入 的 多 播 组 的 地 址 吗 ? 
R35. IGMP 和 广 域 多 播 路 由 选择 协议 所 起 的 作用 是 什么 ? 
R36. 在 多 播 路 由 选择 场合 中 ， 一 棵 组 共享 的 树 与 一 棵 基于 源 的 树 之 间 有 什么 区 别 ? 





习题 


Pl. 在 本 题 中 ， 考 虑 虚 电路 网 络 和 数据 报 网 络 的 某 些 优 缺 点 。 
a 假设 路 由 需 遇 到 了 可 能 经 带 会 引起 它 无 法 正常 运转 的 情况 。 提 出 理由 说 明 是 虚 电路 体系 结构 还 是 
数据 报 体系 结构 更 好 ， 为 什么 ? 
b. 对 于 源 和 目的 结 点 间 传 输 流 量 的 排他 性 使 用 ， 假 设 该 源 和 日 的 结 点 要 求 ， 在 沿 源 到 上 日 的 地 的 路 径 上 的 
所 有 路 由 需 总 能 提供 固定 的 容量 。 提 出 理由 说 明 是 虚 电 路 体系 结构 还 是 数据 报 体 系 结构 更 好 ， 为 什么 ? 
c 假设 网 络 中 的 链 路 和 路 由 器 从 不 出 故障 ， 并 且 所 有 源 / 目 的 地 对 之 间 所 使 用 的 路 径 保 持 不 变 。 在 这 
种 情况 下 ， 虚 电路 或 数据 报 体系 结构 哪个 控制 流量 开销 会 更 多 ?为 什么 ? 
P2. 考虑 一 个 虚 电 路 网 络 。 假 定 其 VC 号 是 一 个 8 比特 字段 ， 
a. 链 路 能 够 承载 的 虚 电 路 的 最 大 数量 是 多 少 ?” 
b. 假定 某 中 心 结 点 在 连接 建立 时 确定 了 路 径 和 VC 号 。 假 定 沿 着 某 虚 电 路 的 路 径 在 每 段 链 路 使 用 相 
同 的 VC 号 。 描 述 在 连接 建立 时 中 心 结 点 如 何 确定 YC 号 。 进 行 中 虚 电 路 比 在 (a) 中 确定 的 最 大 
值 要 少 ， 也 没有 相同 的 未 用 VC 号 ， 这 种 情况 可 能 出 现 吗 ? 
c 假定 沿 着 某 条 虚 电路 的 路 径 允 许 不 同 的 VC 号 。 在 连接 建立 期 间 ， 在 端 到 端 路 径 确定 以 后 ， 描 述 
链 路 如 何以 分 散 方式 而 不 依赖 中 心 结 总 选择 它们 的 VC 号 并 配置 它们 的 转发 表 。 
P3. 在 虚 电路 网 络 中 的 基本 转发 表 具 有 4 列 。 在 这 些 列 中 的 值 的 含义 是 什么 ”在 数据 报 网 络 中 的 基本 转 
发 表 有 了 两 列 。 在 这 些 列 中 的 值 的 含义 是 什么 ? 
P4. 考虑 下 列 网 络 。 
a. 假定 网 络 是 一 个 数据 报 网 络 。 显 示 路 由 器 A 中 的 转发 表 ， 其 中 所 有 指向 主机 H3 的 流量 通过 接口 3 
转发 。 

. 假定 网 络 是 一 个 数据 报 网 络 。 你 能 写 出 路 由 器 A 中 的 转发 表 蚂 ?其 中 所 有 从 Hl 指向 主机 H3 的 流量 
通过 接口 3 转发， 而 所 有 从 H2 指向 主机 H3 的 流量 通过 接口 4 转发 。( 提示 : 这 是 一 个 技巧 问题 ,) 
c 现在 假定 网 络 是 虚 电 路 网 络 ， 在 Hl 和 H3 之 间 有 一 个 进行 中 的 呼叫 ，H2 和 H3 之 间 有 为 一 个 进行 

中 的 呼叫 。 写 出 路 由 间 A 中 的 转发 表 ， 其 中 所 有 从 HI 指向 主机 H3 的 流量 通过 接口 3 转发 ， 而 所 
有 从 H2 指向 主机 H3 的 流量 通过 接口 4 转发 。 
d 假设 场景 与 (c) 中 相同 ， 写 出 在 结 点 B、C 和 D 中 的 转发 表 。 


permease 
j 


— 
ww 





PS. 考虑 一 个 用 2 比特 字段 表示 VC 号 的 虚 电 路 网 络 。 假 定 该 网 络 要 通过 4 条 链 路 〈 链 路 A、 链 路 B、 链 
路 C 和 链 路 D) 建立 一 条 虚 电 路 。 假 定 这 些 链 路 中 的 每 条 当前 都 承载 两 条 其 他 的 虚 电 路 ， 这 些 其 他 
虚 电 路 的 VC 号 如 下 : 
链 路 A 链 路 B 链 路 C 链 路 D 


00 01 10 1] 
01 10 11 00 
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在 回答 下 列 问题 时 ， 记 住 每 个 现 有 的 虚 电 路 可 能 通过 这 4 条 链 路 之 一 . 

a. 如果 每 条 虚 电路 要 求 沿 着 其 路 径 使 用 相同 的 VC 号 ， 能 为 该 新 的 虚 电 路 分 配 什么 样 的 VC 号 ? 

b. 如果 每 条 虚 电路 洛 其 路 径 允 许 不 同 的 链 路 使 用 不 同 的 VC 号 (因此 转发 表 必 须 执行 YC 号 转换 )， 
能 够 使 用 4 个 VC 号 的 多 少 种 不 同 的 组 合 (一 种 组 合用 于 这 4 条 链 路 之 一 )? 

P6. 在 本 书 中 我 们 使 用 术语 面向 连接 服务 来 描述 运输 层 服 务 ， 使 用 术语 连接 服务 描述 网 络 层 服务 。 在 术 
洛 中 为 何 有 这 种 微妙 的 差异 ? 

P7. 假设 两 个 分 组 在 完全 相同 的 时 刻 到 达 一 台 路 由 如 的 两 个 不 同 输入 端口 。 同 时 假设 在 该 路 由 此 中 没有 

其 他 分 组 。 

a. 假设 这 两 个 分 组 朝 着 两 个 不 同 的 输出 端口 转发 ， 当 交换 结构 使 用 一 条 共享 总 线 时 ， 这 两 个 分 组 可 

能 在 相同 时 刻 通 过 交换 结构 转发 吗 ? 

b. 假设 这 两 个 分 组 朝 着 两 个 不 同 的 输出 端口 转发 。 当 交换 结构 使 用 纵横 方式 时 ， 这 两 个 分 组 可 能 在 
相同 时 刻 通 过 交换 结构 转发 吗 ? 

c. 假设 这 两 个 分 组 朝 着 相同 的 输出 端口 转发 。 当 交换 结构 使 用 纵横 方式 时 ， 这 两 个 分 组 可 能 在 相同 
时 刻 通 过 交换 结构 转发 吗 ? 

P8. 在 4.3 节 中 ， 我们 注意 到 如 果 交 换 结 构 比 输入 线路 速率 快 4 倍 ， 其 最 大 的 排队 时 延 为 (n -1)D。 假 
设 所 有 分 组 有 相同 长 度 ， 在 相同 时 刻 n 个 分 组 到 达 个 输出 端口 ， 同 时 所 有 n 个 分 组 要 转发 到 不 同 
的 输出 端口 。 对 于 内 存 、 总 线 和 纵横 式 交 换 结 构 ， 一 个 分 组 的 最 大 时 延 是 多 少 ? 

PO. 考虑 下 列 交 换 机 假设 所 有 数据 报 有 具有 相同 长 度 ， 交 换 机 以 一 种 分 时 际 、 同 步 的 方式 运行 ， 在 一 个 
时 际 中 一 个 数据 报 能 够 从 某 输入 端口 传送 到 某 输 出 端口 ， 其 交换 结构 是 纵横 式 的 ， 因 此 在 一 个 时 际 
中 至 多 一 个 数据 报 能 够 传送 到 一 个 给 定 输出 端口 ， 但 在 一 个 单一 时 际 中 不 同 的 输出 端口 能 够 接收 到 
来 自 不 同 输 入 端口 的 数据 报 ， 从 输入 端口 到 它们 的 输出 端口 传送 所 示 的 分 组 ， 所 需 的 时 际 数 量 最 少 
是 多 少 ? 此 时 假定 使 用 你 所 需要 的 任何 输入 排队 调度 方法 ( 即 此 时 没有 HOL 阻塞 )。 假 定 采 用 你 能 
够 设计 的 最 差 情况 下 的 调度 方案 ,假定 非 空 输入 队列 不 会 空 闪 ， 所 需 的 时 际 数 量 最 大 是 多 少 ? 


一 


a. 





P10. 考虑 使 用 32 比特 主机 地 址 的 某 数据 报 网 络 。 假 定 一 人 台 路 由 器 具有 4 条 链 路 ， 编 号 为 0 ~3， 分 组 能 
被 转发 到 如 下 的 各 链 路 接口 : 


目的 地 址 范围 链 路 接口 
11100000 00000000 00000000 00000000 
到 0 


11100000 00111111 11111111 11111111 


11100000 01000000 00000000 00000000 
到 | ] 
11100000 01000000 11111111 11111111 


11100000 01000001 00000000 00000000 
到 
11100001 01111111 11111111 11111111 


to 


其 他 3 
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PI. 


Phe. 


Fis 


P14. 


PID: 


P16. 


P17. 


P18. 


Pid, 


小 
A 
kh 


a. 提供 一 个 具有 4 个 表 项 的 转发 表 ， 使 用 最 长 前 组 匹配 ， 转 发 分 组 到 正确 的 链 路 接口 ， 
b. 描述 你 的 转发 表 是 如 何 为 具有 下 列 目的 地 址 的 数据 报 决定 适当 链 路 接口 的 
11001000 10010001 01010001 01010101 
11100001 01000000 11000011 00111100 
11100001 10000000 00010001 01110111 
考虑 使 用 8 比特 主机 地 址 的 某 数据 报 网 络 。 假 定 一 台 路 由 融 使 用 最 长 前 级 匹配 并 具有 下 列 转发 表 : 


前 缀 匹配 接口 
00 0 
010 1 
011 2 
10 2 
11 3 


对 这 4 个 接口 中 的 每 个 ， 给 出 相应 的 目的 主机 地 址 的 范围 和 在 该 范围 中 的 地 址 数量 . 
考虑 使 用 8 比特 主机 地 址 的 数据 报 网 络 。 假 定 一 台 路 由 器 使 用 最 长 前 缀 匹配 并 具有 下 列 转发 表 : 


前 缀 匹配 接口 

| 0 
10 I 

111 2 

其 他 3 


对 这 4 个 接口 中 的 每 个 ， 给 出 相应 的 目的 主机 地 址 的 范围 和 在 该 范围 中 的 地 址 数量 。 

考虑 互联 3 个 子 网 ( 子 网 1、 子 网 2 和 子 网 3) 的 一 台 路 由 器 。 假 定 在 这 3 个 子 网 的 每 个 子 网 中 的 所 

有 接口 要 求 具有 前 级 223. 1. 17/24。 还 假定 子 网 1 要 求 支持 多 达 60 个 接口 ， 子 网 2 要 求 文 持 多 达 90 

个 接口 和 子 网 3 要 求 支持 多 达 12 个 接口 。 提 供 3 个 满足 这 些 限 制 的 网 络 地 址 (形式 为 a. b. c. d/x)， 

在 4.2.2 节 中 给 出 了 一 个 转发 表 (使 用 最 长 前 缀 匹配 ) 的 例子 。 使 用 a. b. c dx 记 法 代替 二 进 制 字 

符 串 记 法 ， 重 写 该 转发 表 。 

在 习题 P10 中 要 求 你 给 出 转发 表 (使 用 最 长 前 缀 匹配) EJ a. bc. dx 记 法 代替 二 进 制 字 符 串 记 

考虑 具有 前 级 128. 119. 40. 128/26 的 一 个 子 网 。 给 出 能 被 分 配给 该 网 络 的 一 个 IP 地 址 (形式 为 

xxx. xxx. a aa) WAT 假定 一 个 SP Wn 128. 119. 40. 64/26 的 地 址 块 。 假 定 它 要 从 该 地 

址 块 生成 4 个 子 网 ， 每 块 具有 相同 数量 的 IP 地 址 。 这 4 个子 网 (形式 为 a.b.c. d/x) 的 前 级 是 什么 ? 

考虑 图 4-17 中 显示 的 拓扑 。( 在 12:00 以 顺 时 针 开 始 ) 标记 具有 主机 的 3 个子 网 为 网 络 A、B 和 C. 

标记 没有 主机 的 子 网 为 网 络 D、E 和 下 。 

a 为 这 6 个子 网 分 配 网 络 地 址 ， 要 满足 下 列 限 制 : 所 有 地 址 必须 从 214.97.254/23 起 分 配 ; 子 网 A 
应 当 具 有 足够 地 址 以 支持 250 个 接口 ; 子 网 B 应 当 具 有 足够 地 址 以 支持 120 个 接口 ; 子 网 C 应 = 
具有 足够 地 址 以 支持 120 个 接口 。 当 然 ， 子 网 D、E 和 下 应 当 支 持 两 个 接口 。 对 于 每 个 子 网 ， 分 
配 采 用 的 形式 是 a.b. c. d/x 或 a.b.c.d/x~e.fg.h/y。 

b. 使 用 你 对 (a) 部 分 的 答案 ， 为 这 3 台 路 由 器 中 的 每 台 都 提供 转发 表 (使 用 最 长 前 级 匹配 ). 

使 用 美国 因特网 编码 注册 机 构 (http://www. arin. net/whois) 的 whois 服务 来 确定 三 所 大 学 所 用 的 IP 

地 址 块 。whois 服务 能 被 用 于 确定 某 个 特定 的 IP 地址 的 确定 地 理 位 置 吗 ”使 用 www. maxmind. com 来 

确定 位 于 这 三 所 大 学 的 Web 服务 器 的 位 置 。 

考虑 向 具有 700 字 节 MTU 的 一 条 链 路 发 送 一 个 2400 字 节 的 数据 报 。 假定 初始 数据 报 标 有 标识 号 


P20. 


P21. 


P27. 


P28. 
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422， 将 会 生成 多 少 个 分 片 ? 在 生成 相关 分 片 的 数据 报 中 的 各 个 字段 中 的 值 是 多 少 ? 

假定 在 源 主机 A 和 目的 主机 B 之 间 的 数据 报 被 限制 为 1500 字 节 (包括 首部 )。 假 设 IP 首部 为 20 字 

节 ， 要 发 送 一 个 5MB 组 成 的 MP3 需要 多 少 个 数据 报 ? 解释 你 的 答案 是 如 何 计算 的 。 

戎 虑 在 岁 4-22 中 建立 的 网 络 。 假 定 ISP 此 时 为 路 由 天 分 配 地 址 24. 34. 112.235 以 及 家 庭 网 络 的 网 络 

地 址 是 192. 168. 1/24, 

a. 在 家 庭 网 络 中 为 所 有 接口 分 配 地 址 。 

b. 假定 每 台 主机 具有 两 个 进行 中 的 TCP 连接 ， 所 有 都 是 对 主机 128. 119. 40. 86 的 80 端口 的 。 在 
NAT 转换 表 中 提供 6 个 对 应 表 项 。 


2. 假设 你 有 兴趣 检测 NAT 后 面 的 主机 数量 。 你 观察 到 在 每 个 IP 分 组 上 P 层 顺 序 地 标 出 一 个 标识 号 。 


由 一 台 主 机 生成 的 第 一 个 中 分 组 的 标识 号 是 一 个 随机 数 ， 后 继 IP 分 组 的 标识 号 是 顺序 分 配 的 。 假 

BCH NAT 后 面 主机 产生 的 所 有 IP 分 组 都 发 往外 部 。 

a 基于 这 个 观察 ， 假定 你 能 够 俘获 由 NAT 向 外 部 发 送 的 所 有 分 组 ， 你 能 概要 给 出 一 种 简单 的 技术 
来 检测 NAT 后 面 不 同 主机 的 数量 吗 ? 评估 你 的 答案 。 

b， 如 果 标 识 号 不 是 顺序 分 配 而 是 随机 分 配 的 ， 这 种 技术 还 能 正常 工作 吗 ? 评 佑 你 的 管 案 。 


. 在 这 个 习题 中 ,我们 将 探讨 NAT 对 P2P 应 用 程序 的 影响 。 假 定 具 有 用 户 名 Arnold 的 对 等 方 通过 查 


询 发 现 ， 具 有 用 户 名 Bernard 的 对 等 方 有 一 个 要 下 载 的 文件 。 同 时 假定 Bernard 和 Arnold 都 位 于 NAT 
后 面 。 尝 试 设计 一 种 技术 ， 使 得 Amold 与 Bernard 创建 一 条 TCP 连接 ， 而 不 对 NAT 做 应 用 特定 的 配 
置 。 如 果 你 难以 设计 这 样 的 技术 ， 试 讨论 其 原因 


. 观察 图 4-27， 列 举 从 y Blu 不 包含 任何 环 路 的 路 径 。 

. 重复 习题 P24， 列 举 从 x 到 z、z 到 4 以 及 z 到 w 的 不 包含 任何 环 路 的 路 径 。 

. 考虑 下 面 的 网 络 。 对 于 标明 的 链 路 费用 ， 用 Dijkstra 的 最 短路 径 算法 计算 出 从 x 到 所 有 网 络 结 点 的 
最 短路 径 ， 通 过 计算 一 个 类 似 于 表 4-3 的 表 ， 说 明 该 算法 是 如 何 工作 的 。 


ge 
3 aaa 





考虑 习题 P26 中 所 示 的 网 络 。 使 用 Dijkstra 算法 和 一 个 类 似 于 表 4-3 的 表 来 说 明 你 做 的 工作 : 

a. 计算 出 从 :到 所 有 网 络 结 点 的 最 短路 径 。 

b. 计算 出 从 4 到 所 有 网 络 结 点 的 最 短路 径 。 

ce 计算 出 从 v 到 所 有 网 络 结 点 的 最 短路 径 。 

d. 计算 出 从 w 到 所 有 网 络 结 点 的 最 短路 径 。 

e. 计算 出 从 y 到 所 有 网 络 结 点 的 最 短路 径 。 

f 计算 出 从 z 到 所 有 网 络 结 点 的 最 短路 径 。 

考虑 下 图 所 示 的 网 络 ， 假 设 每 个 结 点 初始 时 知道 到 它 的 每 个 邻居 的 费用 。 考 虑 距离 向 量 算法 ， 并 显 
示 在 结 点 z 中 的 距离 表 表 项 。 
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a ae ee ceil ( 即 不 是 以 上 所 显示 的 特定 网 络 ) 和 一 个 同步 版 本 的 距离 向 量 算 法 。 假设 每 次 
EARN , 结 点 与 其 邻居 交换 其 距离 向 量 并 接收 它们 的 距离 向 量 。 假 定 算法 开始 时 ， 每 个 结 点 只 
知道 到 其 BENENDEN. 在 该 分 布 式 算法 收敛 前 所 需 的 最 大 迭代 次 数 是 多 少 ” 评 估 你 的 答案 . 

考虑 下 图 所 示 的 网 络 段 ,x 只 有 两 个 相连 邻居 w Soy. w 有 一 条 通 向 目的 地 wu (没有 显示 ) 的 最 低 费 
用 路 径 ， 其 值 为 5; y 有 一 条 通 向 目的 地 上 4 的 最 低 费 用 路 径 ， 其 值 为 6。 从 ww 与 y 到 ww (Rwy 
之 间 ) 的 完整 路 径 未 显示 出 来 。 网 络 中 所 有 链 路 费用 皆 为 正 整 数值 。 





a. 给 出 x X H KIHE w, y 和 APS E] ee, 

.给 出 对 c(x，w) elx, y) 的 链 路 费用 的 变化 ， 使 得 执行 了 距离 问 量 算法 后 , x 将 通知 其 邻 拓 
有 一 条 通 问 4 的 新 最 低 费 用 路 径 。 

c 给 出 对 c(x，w) 或 c(x,，Y) 的 链 路 费用 的 变化 ， 使 得 执行 了 距离 问 量 算法 后 ,x 将 不 通知 其 邻 
居 有 一 条 通 向 4 的 新 最 低 费 用 路 径 . 

考虑 如 图 4-30 中 所 示 3 个 结 点 的 拓扑 。 不 使 用 显示 在 图 4-30 中 的 费用 值 ， 链 路 费用 值 现 在 是 c(x， 

y) =3, c(y, z) =6, e(z, x) =4。 在 距离 向 量 表 初 始 化 后 和 在 同步 版 本 的 距离 向 量 算法 每 次 迭代 

后 ,计算 它 的 距离 向 量 表 (如 我 们 以 前 对 图 4-30 讨论 时 所 做 的 那样 ) 。 


— 
- 


2. 考虑 在 距离 向 量 路 由 选择 中 的 无 穷 计数 问题 ， 如 果 我 们 减 小 一 条 链 路 的 费用 ， 将 会 出 现 无 穷 计 数 问 


题 吗 ? 为 什么 ”如 果 我 们 连接 没有 链 路 的 两 个 结 点 ,会 出 现 什么 情况 ? 

讨论 在 图 4-30 中 的 距离 向 量 算法 ， 距 离 向 量 D(x) 中 的 每 个 值 不 是 递增 的 并 且 最 终 将 在 有 限 步 中 稳 

定 下 来 。 

考虑 图 4-31. 假定 有 另 一 台 路 由 器， 与 路 由 器 y 和 = 连接 。 所 有 链 路 的 费用 给 定 如 下 : elx, y) = 

4, ola 0 rly, w) <1, es w) Sly ely. 2) <3 i Ze BE EA REET 

a、 当 距离 向 量 路 由 选择 稳定 时 ， 路 由 器 wx、y 和 = a 通知 它们 的 距离 。 它 们 告诉 彼此 什么 样 的 距离 值 ? 

b. 现在 假设 x A y 之 间 的 链 路 成 本 增加 到 60。 即 使 使 用 了 毒性 逆转 ， 将 会 存在 无 穷 计 数 问题 吗 ” 为 
什么 ”如 果 存 在 无 穷 计数 问题 ， 距 离 向 量 路 由 选择 需要 多 少 次 迭代 才能 再 次 到 达 稳 定 状态 ”评估 
你 的 答案 。 

ce 如 果 ely, x) 从 4 变化 到 60， 怎 样 修改 <c(y，z) 使 得 不 存在 无 穷 计 数 问 题 。 

描述 在 BGP 中 是 如 何 检测 路 径 中 的 环 路 的 。 

一 台 BGP 路 由 器 将 总 是 选择 具有 最 短 AS 路 径 长 度 的 无 环 路 由 吗 ? 评估 你 的 答案 。 

考虑 下 图 所 示 的 网 络 。 假 定 AS3 和 AS2 正在 运行 OSPF 作为 其 AS 内 部 路 由 选择 协议 。 假 定 ASI 和 

AS4 正在 运行 RIP 作为 其 AS 内 部 路 由 选择 协议 。 假 定 AS 间 路 由 选择 协议 使 用 的 是 eBGP 和 1iBCP。 

假定 最 初 在 AS2 和 AS4 之 间 不 存在 物理 链 路 . 
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a PATH dit Sc 从 下 列 哪个 路 巾 选择 协议 学 习 到 了 前 级 x: OSPF, RIP, eBGP 或 iBGP? 
b. PRE dt 3a 从 嘟 个 路 由 选择 协 以 学 习 到 了 前 级 x? 
c. Har le 从 哪个 路 由 选择 协 以 学 习 到 了 了 前缀 a? 
d. 路 由 大 1d 从 哪个 路 由 选择 协议 学 习 到 了 前 级 x? 





参考 上 一 习题 ， 一 旦 路 由 器 1d 知道 了 x 的 情况 ， 它 将 一 个 表 项 (x, ) 放 人 其 转发 表 中 。 

a， 对 这 个 表 项 而 言 ，/ 将 等 于 /还 是 1,? 用 一 句 话 解释 其 原因 。 

b. 现在 假定 在 AS2 和 AS4 之 间 有 一 条 物理 链 路 ， 显 示 为 图 中 的 虚线 。 假 定 路 由 器 1d 知道 经 AS2 以 
及 经 AS3 HEM De] FE x, /将 设置 为 由 还 是 2? 用 一 句 话 解释 其 原因 。 

e 现在 假定 有 另 一 个 AS， 它 称 为 AS5 ， 其 位 于 路 径 AS2 和 AS4 之 间 (没有 显示 在 图 中 ) 。 假 定 路 由 器 
ld 知道 经 AS2 ASS AS4 以 及 经 AS3 AS4 能 够 访问 到 x。1 将 设置 为 上 BL? 用 一 句 话 解 释 其 原因 。 

考虑 下 面 的 网 络 。ISP B 为 地 区 ISP A 提供 国家 主干 网 服务 。ISP C 为 地 区 ISP D 提供 国家 主干 网 服务 。 

每 个 ISP 由 一 个 AS 组 成 。B 和 C 使 用 BGP 在 两 个 地 方 互相 对 等 。 考 虑 从 A 到 DD 的 流量 。B 宁愿 将 流 

量 交 给 西海 岸 的 C (使 得 C 将 必须 承担 承载 跨越 整个 国家 的 流量 的 费用 )， 而 C 宁愿 经 其 东海 岸 与 B 

对 等 的 站 点 得 到 这 些 流量 (使 得 B 将 承载 跨越 整个 国家 的 流量 ) 。C 可 能 会 使 用 什么 样 的 BGP HLH, 

使 得 B 将 通过 东海 岸 对 等 点 传递 A BUD 的 流量 ? 要 回答 这 个 问题 ， 你 需要 钻研 BGP 规范 。 





P40. 在 图 4-42 中 ， 考 虑 到 达 桩 网 WX 和 了 的 路 径 信 息 。 基 于 WW 与 半 处 的 可 用 信息 ， 它 们 分别 看 到 的 


网 络 拓 扑 是 什么 ”评估 你 的 答案 。Y 所 见 的 拓扑 视图 如 下 所 示 。 
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ZER 4-42, 将 不 会 基于 BGP 路 由 选择 经 过 X 以 TY 为 目的 地 转发 流量 - 但 是 有 某 些 极为 流行 的 
应 用 程序 ， 其 数据 分 组 先 员 和 问 X， 然 后 天 流向 Yo 指出 一 种 这 样 的 应 用 程序 ， 擅 述 数据 分 组 是 如 何 
洽 着 这 条 不 由 BCP 路 由 选 搓 给 定 的 路 径流 动 的 : 


. 在 图 4-42 中 ,假定 有 男 一 个 桩 网 络 V， 它 为 JSP A 的 客户 。 假设 B 和 C 具有 对 等 关系 ,并 且 A 是 B 


AC 的 客户 。 假设 A 希望 让 发 加 W 的 流量 仅 来 目 B， 并 且 发 回 V 的 流量 来 自 B 或 C。A 如 何 回 B 和 
C 通告 其 路 由 ?C 收 到 什么 样 的 AS 路 由 ? 


. 假定 AS X 和 AS Z 不 直接 连接 ,但 与 AS Y 连接 。 进 一 步 假定 X 与 Y 具 有 对 等 协定 ，Y 与 Z 具 有 对 
等 协定 。 最 后 ， 假 定 Z 要 传送 所 有 Y 的 流量 但 不 想 传送 X 的 流量 。BGP 允许 Z 实现 这 种 策略 吗 ? 

. 考虑 习题 P26 中 7 个 结 点 的 网 络 ( 结 点 标 为 :~z)。 给 出 根 在 z 的 包括 (作为 端 主 机 ) iiu, v, w 
Ally 的 最 低 费 用 树 。 非 形式 化 地 讨论 一 下 ， 为 什么 你 给 出 的 树 是 一 棵 最 低 费 用 树 。 

. 考虑 实现 广播 的 两 种 基本 方法 : 单 播 模拟 与 网 络 层 〈 即 路 由 硕 协 助 ) 广播 ， 并 假定 使 用 生成 树 广播 


来 实现 网 络 层 广播 。 考虑 有 一 个 发 送 方 与 32 个 接收 方 。 假设 发 送 方 通过 一 棵 路 由 需 二 又 树 与 接收 
方 相连 。 在 单 播 模拟 与 网 络 层 广播 情况 下 ， 对 于 这 个 拓扑 ， 发 送 一 个 广播 分 组 的 费用 各 是 多 少 ” 这 
里 每 次 经 单一 链 路 发 送 一 个 分 组 (或 一 个 分 组 的 副本 )， 产生 一 个 单位 费用 。 用 什么 样 的 拓扑 互联 
发 送 方 、 接 收 方 和 路 由 器 ， 将 使 得 单 播 模 拟 与 真正 的 网 络 层 广播 产 生 的 费用 相差 尽 可 能 大 ? 你 可 接 
照 上 自己 的 意愿 选择 多 人 台 路 由 耸 

考虑 图 4-44 中 反 向 路 径 转发 (RPF) 算法 的 运行 。 使 用 相同 的 拓扑 ， 找 出 从 所 有 结 扣 到 源 结 点 A 
的 一 系列 路 径 (并 像 在 图 4-44 中 那样 用 粗 线 指出 这 些 路 径 )， 使 得 如 果 这 些 路 径 是 最 低 费 用 路 径 ， 
则 结 点 B 将 接收 来 自 使 用 RPF 的 结 点 A、C 和 D 的 A 的 广播 报 文 的 副本 。 

GBA 4-44 中 所 示 的 拓扑 。 假 定 所 有 链 路 具有 单位 费用 并 且 结 点 上 是 广播 源 。 在 给 定 结 点 上 上 为 源 
的 情况 下 ， 使 用 如 图 4-44 中 所 示 的 箭头 ， 指 出 使 用 RPF 转发 分 组 的 链 路 ,以 及 不 转发 分 组 的 链 路 。 
使 用 习题 P26 中 的 图 重复 习题 B47。 假定 : 是 广播 源 ， 并 且 链 路 费用 如 在 习题 P26 中 所 示 。 

考虑 在 图 4-46 中 所 显示 的 折 扑 ， 并 假定 每 段 链 路 有 单位 费用 。 假 设 结 点 C 在 基于 中 心 的 多 播 路 由 
选择 算法 中 被 选 为 中 心 。 假 定 每 个 相连 路 由 需 都 使 用 到 结 点 C 的 最 低 费 用 路 径 同 C 发 送 加 入 报 文 ， 
画 出 所 产生 的 基于 中 心 的 多 播 路 由 选择 树 。 产 生 的 树 是 一 棵 最 低 费 用 树 吗 ” 评 佑 你 的 答案 。 

重复 习题 49， 使 用 习题 P26 中 的 图 。 假 定 中 心绪 点 是 vo 

在 4.5.1 节 中 我 们 学 习 了 计算 单 播 路 径 的 Dijkstra 的 链 路 状态 路 由 选择 算法 ， 这 些 单 播 路 径 分 别 是 
从 源 到 所 有 目的 地 的 最 小 费用 路 径 。 这 些 路 径 的 并 集 能 够 锌 认为 形成 了 一 棵 最 低 单 播 费 用 路 径 树 
(或 一 棵 最 短 单 播 路 径 树 ， 如 果 所 有 链 路 费用 是 相同 的 ) 。 通 过 构造 一 个 反例 ， 表 明 最 低 费 用 路 径 树 
并 不 总 是 与 最 小 生成 树 相 同 。 

考虑 所 有 结 点 与 3 个 其 他 结 点 相连 的 网 络 。 在 单一 时 间 步 中 ， 一 个 结 点 能 够 从 它 的 邻居 接收 到 所 有 
传输 的 广播 分 组 ， 复 制 分 组 ， 并 回 它 的 所 有 邻居 发 送 之 〈 除 了 发 送 给 定 分 组 的 那个 结 点 ) 。 在 下 个 
时 间 步 中 ， 相 邻 结 点 能 够 接收 、 复 制 和 转发 这 些 分 组 等 等 。 假 定 使 用 无 控制 洪 泛 以 在 这 样 的 网 络 中 
提供 广播 。 在 时 间 步 +， 多 少 个 广播 分 组 的 副本 将 被 传输 ， 假 定 在 时 间 步 1 期 间 ， 由 源 结 点 同 它 的 3 
个 部 导 传输 单个 广播 分 组 - 


. 我 们 在 4.7 节 中 看 到 ， 没 有 任何 网 络 层 协议 能 用 于 标识 参与 一 个 多 播 组 的 主机 。 在 这 种 情况 下 ， 多 


播 应 用 程序 怎样 知道 参与 一 个 多 播 组 的 主机 的 号 份 ? 


. 设计 (给 出 伪 代 码 摘 述 ) 一 个 应 用 级 协议 ， 该 协议 维护 参与 一 个 多 播 组 的 所 有 主机 的 地 址 。 特 别 要 


指出 你 的 协议 所 使 用 的 网 络 服务 ( 单 播 或 多 播 ) ， 还 要 指出 你 的 协议 发 送 报 文 是 在 带 内 还 是 带 外 
(关于 多 播 组 参与 者 之 间 的 应 用 数据 流 ) 并 说 明 其 理由 。 

多 播 地 址 空间 的 尺寸 有 多 大 ? 假设 现 有 两 个 不 同 的 多 播 组 随机 地 选择 一 个 多 播 地 址 。 它 们 选择 同一 
个 地 址 的 概率 有 多 大 ?假设 现 有 1000 个 多 播 组 同时 正在 进行 ， 随 机 选择 它们 的 多 播 组 地 址 。 它 们 
冲突 的 概率 有 多 大 ? 
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套 接 字 编程 作业 

在 第 2 草 结 尾 给 出 了 四 个 套 接 字 编程 作业 。 下 面 给 出 第 5 个 应 用 ICMP 的 作业 ，ICMP 的 是 本 章 讨论 
的 协议 。 

作业 5: ICMP ping 

ping 是 一 种 流行 的 网 络 应 用 程序 ， 用 于 测试 位 于 远程 的 某 个 特定 的 主机 是 否 开机 和 可 达 。 它 也 经 常 
用 于 测量 客户 主机 和 目标 主机 之 间 的 时 延 。 它 的 工作 过 程 是 : 向 目标 主机 发 送 ICMP“ 回 显 请 求 ” 分 组 
( 即 ping 分 组 ) ， 并 且 侦 听 ICMP“ 回 显 啊 应 ”应 答 ( 即 pong 分 组 ) ping 测量 RRT、 记 录 分 组 丢失 和 计 
算 多 个 ping-pong 交换 (往返 时 间 的 最 小 、 平 均 、 最 大 和 标准 差 ) 的 统计 汇总 。 

在 本 实验 中 ， 你 将 用 Python 语言 编写 自己 的 ping 应 用 程序 。 你 的 应 用 程序 将 使 用 ICMP。 但 为 了 保 
持 程序 的 简单 ， 你 将 不 完全 遵循 RFC 1739 中 的 官方 规范 。 注 意 到 你 将 仅 需要 写 该 程序 的 客户 程序 ， 因 为 
服务 器 侧 所 需 的 功能 构建 在 几乎 所 有 的 操作 系统 中 。 你 能 够 在 Web 站 点 http://www. awl. com/kurose- ross 
找到 本 作业 的 全 面 细 节 ， 以 及 该 Python 代码 的 重要 片段 。 





编程 作业 
在 本 编程 作业 中 ， 你 要 写 一 组 的 “分 布 式 ”过 程 ， 以 为 下 图 所 示 的 网 络 实现 一 个 分 布 式 异步 距离 向 
量 路 由 选择 算法 ， 





尔 要 写 出 下 列 例 程 ， 这些 例 程 将 在 为 该 作业 提供 的 模拟 环境 中 异步 “执行 "。 对 于 结 点 0， 你 将 写 出 


这 样 的 例 程 : 
。 rtinit0() 。 在 模拟 开始 将 调用 一 次 该 例 程 。rtinit0() 无 参数 。 它 应 当初 始 化 结 点 0 中 的 距离 表 ， 以 
反映 出 到 达 结 点 1、2 和 3 的 直接 费用 分 别 为 1、3 和 7。 在 上 图 中 ,所 有 链 路 都 是 双向 的 ， 两 个 


方 回 的 费用 皆 相 同 。 在 初始 化 距离 表 和 结 点 0 的 例 程 所 需 的 其 他 数据 结构 后 ， 它 应 向 其 直接 连接 
的 邻居 (在 本 情况 中 为 结 点 1、2 和 3) 发 送 它 到 所 有 其 他 网 络 结 点 的 最 低 费用 路 径 的 费用 信息 。 
通过 调用 例 程 tolayer2() ， 这 种 最 低 费 用 信息 在 一 个 路 由 选择 更 新 分 组 中 被 发 送 给 相 邻 结 点 ， 就 
像 在 完整 编程 作业 中 描述 的 那样 。 路 由 选择 更 新 分 组 的 格式 也 在 完整 编程 作业 中 进行 描述 。 

è rtupdate0( struct rtpkt *revdpkt)。 当 结 点 0 收 到 一 个 由 其 直接 相连 邻居 之 一 发 给 它 的 路 由 选择 分 
组 时 ， 调 用 该 例 程 。 参 数 * revdpkt 是 一 个 指向 接收 分 组 的 指针 。rtupdate0() 是 距离 向 量 算法 的 
“核心 ”"。 它 从 其 他 结 点 i 接收 的 路 由 选择 更 新 分 组 中 包含 结 点 1 到 所 有 其 他 网 络 结 点 的 当前 最 短 
路 费用 值 。rtupdate0() 使 用 这 些 收 到 的 值 来 更 新 其 自身 的 距离 表 (这 是 由 距离 向 量 算法 所 规定 的 ) o 
如 果 它 目 己 到 男 外 结 点 的 最 低 费 用 因此 更 新 而 发 生 改变 的 话 ， 则 结 点 0 通过 发 送 一 个 路 由 选择 分 组 
来 通知 其 直接 相连 邻居 这 种 最 低 费 用 的 变化 。 我 们 在 距离 向 量 算法 中 讲 过 ， 仅 有 直接 相连 的 结 点 
才 交 换 路 由 选择 分 组 。 因 此 ， 结 点 1 和 结 点 2 将 相互 通信 ,但 结 点 1 和 结 点 3 将 不 相互 通信 。 

为 结 点 1、2、3 定义 类 似 的 例 程 。 因 此 你 总 共 将 写 出 8 个 过 程 : rinit0() rtint () 、rtinit2() 、rtinit3 () 、 
rtupdate0() 、rtupdatel() 、rtupdate2() 和 rtupdate3() 。 这 些 例 程 将 共同 实现 一 个 分 布 式 的 、 与 图 中 所 示 拓 扑 
和 费用 相关 的 距离 表 的 异步 计算 。 

你 可 在 网 址 http://www. awl. com/kurose- ross 处 找到 该 编程 作业 的 全 部 详细 资料 ， 以 及 你 创建 模拟 便 
件 / 软 件 环境 所 需 的 人 C 程序 代码 。 一 个 Java 版 的 编程 作业 也 可 供 使 用 。 
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Ai Wireshark 实验 


在 与 本 书 配套 的 Web 站 点 http://www. awl. com/kurose-ross 上 ， 你 将 找到 两 个 Wireshark 实验 作业 第 
一 个 实验 研究 了 IP 协议 的 运行 ， 特 别 是 IP 数据 报 的 格式 、 第 二 个 实验 探讨 了 在 ping 和 traceroute 命令 中 
ICMP 协议 的 使 用 


人 物 专访 


Vinton G. Cerf Æ Internet Evangelist for Google 公司 的 副 总 裁 兼 总 管 . 他 在 
MCI 公司 的 各 种 职位 上 服务 了 16 年 ， 最 后 以 技术 战略 部 资深 副 总 pee H Asp 25 
束 了 他 在 那里 的 任期 . 他 是 众所周知 的 TCP/IP 协议 和 因特网 体系 结构 的 共同 
设计 者 1976 年 到 1982 年 在 美国 国防 部 高 级 研究 计划 署 (DARPA) 任职 期 
间 ， 他 在 领导 因特网 和 与 因特网 相关 的 数据 分 组 与 安全 技术 的 研发 方面 发 挥 了 
重要 作用 .他 于 2005 年 获得 了 美国 总 统 自由 奖章 ， 于 1977 年 获得 了 美国 国家 | ~ 
技术 奖章 .他 在 斯 坦 福 大 学 获得 数学 学 士 学 位 ， 在 加 利 福 尼 亚 大 学 洛 杉 砚 分 校 Vinog Caf 
(UCLA) 获得 了 计算 机 科学 的 硕士 和 博士 学 位 . 





© 是 什么 使 您 专注 于 网 络 技 术 的 呢 ? 

在 20 世纪 60 EIER, RE UCLA 一 直 做 程序 员 的 工作 。 我 的 工作 得 到 了 美国 国防 部 高 级 研究 计划 
& ( 那 时 叫 ARPA， 现 在 叫 DARPA) 的 支持 。 我 那 时 在 刚 创 建 不 久 的 ARPAnet 的 网 络 测量 中 心 ， 为 
Leonard Kleinrock 教授 的 实验 室 工 作 。ARPAnet 的 第 一 个 结 点 于 1969 年 9 月 1 日 安装 在 UCLA。 我 负责 为 计 
算 机 编程 ， 以 获取 有 关 ARPAnet 的 性 能 信息 ， 并 报告 这 些 信息 以 便 与 数学 模型 作 比较 ， 预 测 网 络 性 能 

其 他 儿 名 研究 生 和 我 负责 侠 制 所 谓 的 ARPAnet 主机 级 协议 ， 该 协议 的 过 程 和 格式 将 使 得 网 络 中 许多 
不 同类 型 的 计算 机 相互 交互 。 这 是 我 进入 分 布 式 计算 与 通信 新 世界 中 的 一 次 迷人 的 探索 。 

© 当 您 第 一 次 设计 该 协议 时 ， 您 曾 想象 过 IP 会 像 今 天 这 样 变 得 无 所 不 在 吗 ? 

当 Bob Kahn 和 我 于 1973 年 最 初 从 事 该 项 工作 时 ， 我 想 我 们 的 注意 力 大 多 集中 在 这 样 一 个 重要 的 问 
题 : 假定 我 们 不 能 实际 改变 这 些 网 络 本 里 ， 那 么 怎样 才能 让 异 构 的 分 组 网 络 彼此 互 操 作 呢 ”我 们 希望 能 
找到 一 种 方法 可 以 使 任意 多 的 分 组 交换 网 以 透明 的 方式 进行 互联 ， 以 便 主机 彼此 之 间 不 做 任何 转换 就 能 
进行 端 到 端 通信 : 我 认为 我 们 那 时 已 经 知道 了 我 们 正在 处 理 强 大 的 和 可 扩充 的 技术 ,但 还 没 清楚 地 想 过 
有 数 亿 宇 计算 机 都 连 入 因特网 时 的 世界 会 是 什么 样 . 

e 您 现在 能 预见 网 络 与 因特网 的 未 来 四 ?7 您 认为 在 它们 的 发 展 中 存在 的 最 大 挑战 或 障碍 是 什么 

我 相信 因特网 本 映 以 及 一 般 的 网 络 都 将 要 继续 扩大 。 已 有 令 人 信服 的 证 据 表明 ， 在 因特网 上 将 有 数 
十 亿 个 因特网 使 能 设备 ， 包 插 移 动 电 话 、 冰 箱 、 个 人 数字 助理 、 家 用 服务 器 、 电 视 等 家 用 电器 ， 以 及 大 
批 通 过 的 便携 机 、 服 务 器 等 。 重 大 挑战 包括 文 持 移 动 性 、 电 池 寿 偷 、 网 络 接 入 链 路 的 容量 、 以 不 受 限 的 
方式 扩展 网 络 光学 核心 的 能 力 。 设计 因特网 的 星际 由 懂 是 我 在 喷 【 推 进 实 验 室 深 入 研究 的 一 项 计 节 。 我 
们 需要 从 IPv4 (32 比特 地 址 ) 过 渡 到 IPv6 (128 比特 ) ， 要 做 的 事情 实在 是 太 多 了 1! 

e 是 谁 激发 了 您 专业 上 的 灵感 呢 ? 

我 的 同事 Bob Kahn 、 我 的 论文 导师 Gerald Estrin、 我 最 好 的 朋友 Steve Crocker (我 们 在 高 中 就 认识 
了 ，1960 年 是 他 带 我 进入 了 计算 机 学 科 之 门 1) ， 以 及 数 千 名 今天 仍 在 继续 推动 因特网 发 展 的 工程 师 . 

e 您 对 进入 网 络 / 因 特 网 领域 的 学 生 有 什么 忠告 吗 ? 

要 跳出 现 有 系统 的 限制 来 思考 问题 ， 想 一 想 什么 是 可 行 的 ; 随后 再 做 艰 兰 工作 以 谋划 如 何 从 事物 的 
当前 状态 到 达 所 想 的 状态 。 要 敢于 想象 : 喷气 推进 实验 室 的 6 个 同事 和 我 一 直 在 从 事 陆地 因特网 的 星际 
扩展 设计 : 这 也 许 要 花 几 十 年 才能 实现 ， 任 务 会 一 个 接着 一 个 地 出 现 ， 可 以 用 这 人 句 话 来 总 结 : “一 个 人 
总 是 要 不 断 地 超越 自我 ， 否 则 还 有 什么 乐趣 可 言 ?” 
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链 路 层 : 链 路 、 接 和 人 网 和 局 域 网 





在 上 一 草 中 ， 我 们 学 习 了 网 络 层 提供 的 任意 两 台 主 机 之 间 的 通信 服务。 在 两 台 主 机 之 
间 ， 数 据 报 跨越 一 系列 通信 和 链 路 传输 ， 一 些 是 有 线 链 路 ， 而 一 些 是 无 线 链 路 ， 从 源 主 机 起 
台 ， 通 过 一 系列 分 组 交换 机 《交换 机 和 路 由 硕 ) ， 在 目的 主机 结束 。 当 我 们 沿 协 议 栈 继续 
往 下 ， 从 网 络 层 到 达 链 路 层 ， 我 们 目 然而 然 地 想 知 道 分 组 是 如 何 通过 构成 病 到 冰 通 信和 路 径 
的 各 段 链 路 的 。 为 了 在 单 段 链 路 上 传输 ， 网 络 层 的 数据 报 是 怎样 被 封 究 进 链 路 层 帧 的 呢 ? 
沿 此 通信 路 径 ， 不 同 的 链 路 能 够 采用 不 同 的 链 路 层 协 以 吗 ? 在 广播 链 路 中 传输 碰撞 是 如 何 
解决 的 ?在 链 路 层 存 在 编 址 吗 ?如 果 需 要 ， 链 路 层 编 址 如 何 与 我 们 在 第 4 草 中 学习 的 网 络 
层 编 址 一 起 运行 呢 ? 交换 机 和 路 由 需 之 间 到 底 有 哪些 差异 ?我们 将 在 本 曹 回 答 这 些 和 其 他 
一 些 重要 的 问题 。 

在 链 路 层 的 讨论 中 ， 我 们 将 看 到 两 种 截然 不 同类 型 的 链 路 层 信道 。 第 一 种 类 型 是 广播 
信道 ， 这 种 信道 用 于 连接 有 线 局 域 网 、 卫 星 网 和 混合 光纤 同 轴 电 缠 (Hybrid Fiber Coaxial 
cable, HFC) 接 入 网 中 的 多 台 主 机 。 因 为 许多 主机 与 相同 的 广播 信道 连接 ， BET A 
体 访 问 协议 来 协调 帧 传输 。 在 茶 些 场合 中 ， 可 以 使 用 中 心 控制 大 来 协调 传输 。 第 二 种 类 型 
的 链 路 层 信道 是 点 对 点 通信 和 链 路 ， 这 在 诸如 长 距离 链 路 连接 的 两 台 路 由 融 之 加 ， 或 用 户 办 
公 室 计 算 机 与 它们 所 连接 的 邻近 以 太 网 交换 机 之 间 等 场合 经 前 能 够 发 现 。 协调 对 点 对 点 链 
路 的 访问 较为 简单 ; 在 本 书 Web 网 站 上 的 相关 材料 详细 地 讨论 了 点 到 点 协议 ( Point- to- 
Point Protocol, PPP) ， 该 协议 的 适用 范围 从 经 电话 线 的 拨号 服务 到 经 光纤 链 路 的 高 速 点 到 
点 帧 传输 。 

我 们 将 在 本 章 中 人 研讨 几 个 链 路 层 概 念 和 技术 。 我 们 将 更 深入 地 人 研究 差错 检测 和 纠正 ， 
这 个 主题 我 们 在 第 3 章 中 简要 讨论 过 。 我 们 将 考虑 多 路 访问 网 络 和 交换 局 域 网 ， 包 括 以 太 
网 ， 这 是 上 日 前 最 流行 的 有 线 局 域 网 技术 。 我 们 还 将 学 习 虚 拟 局 域 网 和 数据 中 心 网 络 。 尽 管 


ViFi 及 更 一 般 的 无 线 局 域 网 都 属于 链 路 层 范围 ， 但 我 们 将 在 第 6 章 才 学 习 这 些 重要 的 


5.1 链 路 层 概述 


我 们 首先 学 习 一 些 有 用 的 术语 。 在 本 章 中 为 方便 讨论 ， 将 运行 链 路 层 协 议 〈 即 第 2 
层 ) 协议 的 任何 设备 均 称 为 结 点 《node) 。 结 点 包括 主机 、 路 由 船 、 交 换 机 和 Wiki Pe A 
(在 第 6 章 中 讨论 ) 。 我 们 也 把 沿 着 通信 路 径 连 接 相 邻 结 点 的 通信 信道 称 为 链 路 (link) 。 
为 了 将 一 个 数据 报 从 源 主 机 传输 到 目的 主机 ， 数 据 报 必 须 通过 汽 病 到 靖 路 径 上 的 各 段 链 路 
传输 。 举 例 来 说 ， 显 示 在 图 5-1 下 部 的 公司 网 络 中 ,考虑 从 无 线 主 机 之 一 问 服 务 笑 之 一 发 
送 一 个 数据 报 。 该 数据 报 将 实际 通过 6 段 链 路 : 发 送 主机 二 WiFi 接 和 人 点 之 间 的 Wiki BE 
路 ， 接 入 点 和 链 路 层 交 换 机 之 间 的 以 太 网 链 路 ， 链 路 层 交 换 机 与 路 由 副 之 间 的 链 路 ， 两 台 
路 由 需 之 同 的 链 路 ， 最 后 是 交换 机 和 服务 需 之 间 的 以 太 网 链 路 。 在 通过 特定 的 链 路 时 ， 传 
省 结 点 将 数据 报 封装 在 链 路 层 帧 中 ， 并 将 该 帧 传送 到 链 路 中 。 
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公司 网 络 


图 5-1 无 线 主 机 和 服务 融 之 间 的 6 个 链 路 层 跳 


为 了 透彻 理解 链 路 层 以 及 它 是 如 何 与 网 络 层 关 联 的 ， 我 们 考虑 一 个 交通 运输 的 类 比例 
于 ,假如 一 个 旅行 社 计划 为 游客 开辟 从 美国 新 泽 西 州 的 普林斯顿 到 瑞士 洛 芝 的 旅游 路 线 。 
假定 该 旅行 社 认为 对 于 游客 而 言 最 为 便利 的 方案 是 : 从 普林斯顿 乘 聚 华 大 轿车 到 JFK 机 
场 ， 然 后 乘 飞 机 从 JFK ae ee 最 后 乘 火车 从 日 内 瓦 机 场 到 洛桑 火车 站 .一 日 
Me Tete Fix 3 项 预定 ， Sea ae 司 将 负责 将 游客 从 普林斯顿 市 到 JFK, 
航空 公司 将 负责 性 游 客 从 JFK 带 到 日 内 瓦 ， 瑞 士 火车 服务 将 负责 将 游客 从 日 内 瓦 审 到 洛 
双 .该 旅程 中 3 Fe ee an 地 点 之 间 是 “下 达 的 ”. 注意 到 这 3 段 运 
输 是 由 不 同 的 公司 管理 ,使 用 了 完全 不 同 的 运输 方式 (豪华 大 轿车 、 飞 机 和 火车 )。 尽 管 
运输 方式 不 同 ， ott 将 旅客 从 一 个 地 点 运输 到 相 邻 地 点 的 基本 服务 。 在 这 个 运 
输 类 比 中 ， 一 个 游客 好 比 一 个 数据 报 ， 每 个 运输 区 段 好 比 一 条 链 路 ， 每 种 运输 方式 好 比 一 
种 链 路 层 协 议 ， 而 该 旅行 社 好 比 一 个 路 由 选择 协议 . 
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链 路 层 提供 的 服务 


尽管 任 一 链 路 层 的 基本 服务 都 是 将 数据 报 通过 单一 通信 链 路 从 一 个 结 点 移动 到 相 邻 结 


点 ， 但 所 提供 的 服务 细节 能 够 随 着 链 路 层 协 议 的 不 同 而 变化 ， 链 路 层 协议 能 够 提供 的 可 能 
服务 包括 : 
e oP (framing). 在 每 个 网 络 层 数据 报 经 链 路 传送 之 前 ， 几 乎 所 有 的 链 路 层 协议 都 


要 将 其 用 链 路 层 帧 封装 起 来 。 一 个 帧 由 一 个 数据 字段 和 耕 干 首部 字段 组 成 ， 其 中 
网 络 层 数据 报 就 插 在 数据 字段 中 。 帧 的 结构 由 链 路 层 协议 规定 。 当 我 们 在 本 草 的 
后 半 部 分 研究 具体 的 链 路 层 协 议 时 ， 将 看 到 几 种 不 同 的 帧 格式 。 

链 路 接 入 。 媒 体 访 问 控制 (Medium Access Control, MAC) 协议 规定 了 帆 在 链 路 上 
fea A ASU. TP Ae BE A — an TA BRT. ERA — m TA PET 
的 点 对 点 链 路 ，MAC 协议 比较 简单 〈 或 者 不 存在 ) ， 即 无 论 何 时 链 路 空 亲 ， 发 送 
方 都 能 够 发 送 帧 。 更 有 趣 的 情况 是 当 多 个 结 点 共享 单个 广播 链 路 时 ， 即 所 谓 多 路 
访问 问题 . 这 里 ，MAC 协议 用 于 协调 多 个 绪 点 的 帧 传输 。 

可 靠 交 付 。 当 链 路 层 协 以 提供 可 徘 交 付 服务 时 ， 它 保证 无 差 铺 地 经 链 路 层 移动 每 
个 网 络 层 数据 报 。 前 面 讲 过 ， 某 些 运输 层 协 以 〈 例 如 TCP) 也 提供 可 徘 交 付 服务 。 
与 运输 层 可 靠 交 付 服 务 类 似 ， 链 路 层 的 可 靠 交 付 服务 通常 是 通过 确认 和 重 传 取 得 
的 〈 参 见 3.4 节 )。 链 路 层 可 靠 交 付 服务 通 凋 用 于 易于 产生 高 差错 率 的 链 路 ， 例 如 
无 线 链 路 ， 其 日 的 是 本 地 (也 就 是 在 差错 发 生 的 链 路 上 ) 纠正 一 个 差 销 ， 而 不 是 通 
过 运输 层 或 应 用 层 协 议 迫 使 进行 端 到 妆 的 数据 重 传 。 然 而 ， 对 于 低 比 特 差 错 的 链 路 ， 
包括 光纤 、 同 轴 电 缆 和 许多 双 绞 铜 线 链 路 ， 链 路 层 可 菲 交 付 可 能 会 被 认为 是 一 种 不 
必要 的 开销 。 由 于 这 个 原因 ， 许 多 有 线 的 链 路 层 协议 不 提供 可 菲 交 付 服务 。 

差错 检测 和 纠正 。 当 帧 中 的 一 个 比特 作为 1 传输 时 ， 接 收 方 结 点 中 的 链 路 层 硬 件 可 
能 不 正确 地 将 其 判断 为 0， 反 之 亦 然 。 这 种 比特 差错 是 由 信号 袁 减 和 电磁 吕 声 导致 
的 。 因 为 没有 必要 转发 一 个 有 差错 的 数据 报 ， 所 以 许多 链 路 层 协议 提供 一 种 机 制 来 
检测 这 样 的 比特 差错 。 通 过 让 发 送 结 点 在 帧 中 包括 差错 检测 比特 ， 让 接收 结 点 进行 
差错 检查 ， 以 此 来 完成 这 项 工作 。 第 3 章 和 第 4 章 讲 过 ， 因 特 网 的 运输 层 和 网 络 层 
也 提供 了 有 限 形式 的 差错 检测 ， 即 因特网 检验 和 。 链 路 层 的 差 销 检测 通常 更 复杂 ， 
并 且 用 硬件 实现 。 差错 纠正 类 似 于 差错 检测 ， 区 别 在 于 接收 方 不 仅 能 检测 帧 中 出 现 
的 比特 差错 ， 而 且 能 够 准确 地 确定 帧 中 的 差错 出 现 的 位 置 (并 因此 纠正 这 些 差 针 ). 


5.1.2 链 路 层 在 何 处 实现 


在 深入 学 习 链 路 层 的 细节 之 前 ， 本 概述 的 最 后 一 节 考虑 一 下 在 何 处 实现 链 路 层 的 问 


题 。 我 们 将 关注 一 个 端 系统 ， 因 为 我 们 在 第 4 革 中 知道 链 路 层 是 实现 在 路 由 带 的 线路 卡 中 
的 。 主 机 的 链 路 层 是 用 硬件 还 是 用 软件 实现 的 呢 ?” 它 是 实现 在 一 块 单独 的 卡 上 还 是 一 个 心 
片上 ? 它 是 怎样 与 主机 的 硬件 和 操作 系统 组 件 的 其 他 部 分 接口 的 呢 ? 


图 5-2 显示 了 一 个 典型 的 主机 体系 结构 。 链 路 层 的 主体 部 分 是 在 网 络 适配器 (network 


adapter) 中 实现 的 ， 网 络 适 配 玉 有 时 也 称 为 网 络 接 口 卡 (Network Interface Card, NIC) 。 
位 于 网 络 适 配 硕 核心 的 是 链 路 层 控制 器 ， 该 控制 需 通 常 是 一 个 实现 了 许多 链 路 层 服务 (成 
帧 、 链 路 接 入 、 差 错 检测 等 ) 的 专用 芯片 。 因此 ， 链 路 层 控 制 需 的 许多 功能 是 用 硬件 实现 
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AJS PAG, Intel 的 8254x Psl # [Intel 2012] 实现 了 以 太 网 协议 ， 我 们 将 在 5.5 市 中 学 习 
ZHY; Atheros AR5006[ Atheros 2012] 控制 器 实现 了 802. 11 WiFi 协议 ， 我 们 将 在 第 6 BE 
学 习 该 协议 。 直 到 20 世纪 90 年 代 后 期 ， 大 部 分 网 络 适 配 需 还 是 物理 上 分 离 的 卡 〈 如 一 块 
PCMCIA 卡 或 者 一 块 插 进 PC 的 PCI 卡 槽 中 的 插入 卡 ) ， 但 越 来 越 多 的 网 络 适 配 埋 被 综合 进 
主机 的 主板 即 所 谓 的 局 域 网 在 主板 配置 。 

在 发 送 端 ， 控 制 费 取得 了 由 协议 栈 较 高 层 生 成 并 存储 在 主机 内 存 中 的 数据 报 ， 在 链 路 
层 帆 中 封装 该 数据 报 ( 填 与 该 帧 的 各 个 字段 )， 然后 但 循 链 路 接 入 协议 将 该 帆 传 进 通 信和 链 
路 中 - 在 接收 端 ， 控 制 费 接收 了 整个 帧 ， 抽 取出 网 络 层 数 据 报 。 如 果 链 路 层 执 行 差 馈 检 
测 ， 则 需要 发 送 控制 带 在 该 帧 的 首部 设置 差错 检测 比特 ， 由 接收 控制 带 执 行 差 包 检测， 

图 5-2 显示 了 与 主机 总 线 (例如 一 条 PCI 或 PCI-X 总 线 ) 连接 的 网 络 适 配器 ， 这 里 它 
看 起 来 非常 像 与 其 他 主机 组 件 连 接 的 任何 其 主机 
他 LO 设备 。 图 5-2 还 显示 了 尽管 大 部 分 链 
路 层 是 在 便 件 中 实现 的 ， 但 部 分 链 路 层 是 在 
运行 于 主机 CPU 上 的 软件 中 实现 的 ， 链 路 层 





的 软件 组 件 实现 了 高 层 链 路 层 功 能 ， 如 组 妆 se 
(例如 PCIT) 


链 路 层 寻 址 信息 和 激活 控制 句 硬 件 .， 在 接收 
端 ， 链 路 层 软 件 啊 应 控制 部 中 断 〈 例 如， 由 
于 一 个 或 多 个 帧 的 到 达 ) ， 处 理 差 错 条 件 和 
将 数据 报 回 上 传递 给 网 络 层 . 所 以 ， 链 路 层 
是 硬件 和 软件 的 结合 体 ， 即 此 处 是 协议 栈 中 
软件 与 便 件 交接 的 地 方 。 | Intel 20121 从 软 
件 编程 的 角度 提供 了 有关 8245x Fe iil AB AY FT 图 5-2 ”网络 适配器 : 它 与 其 他 主机 组 件 及 
读 性 很 强 的 概述 (以 及 详细 的 描述 ) 。 协议 栈 功 能 的 关系 


9.2 差错 检测 和 纠正 技术 


| 
| 


作 上 一 节 中 ， 我 们 提 到 了 比特 级 差错 检测 和 纪 正 (bit- level error detection and correc- 
tion), ， 即 对 从 一 个 结 点 发 送 到 另 一 个 物理 上 连接 的 邻近 结 点 的 链 路 层 帧 中 的 比特 损伤 进行 
检测 和 纠正 ， 它 们 通常 是 链 路 层 提 供 的 两 种 服务 . 我 们 在 第 3 革 中 看 到 差错 检测 和 纠正 服 
务 通常 也 由 运输 层 提 供 。 在 本 节 中 ， 我 们 将 人 研究 几 种 最 简单 的 技术 ， 它 们 能 够 用 于 检测 比 
特 差 错 ， 而 且 在 某 些 情况 下 ， 能 够 纠 止 这 样 的 比特 差错 。 对 该 主题 理论 和 实现 的 全 面 撕 述 
是 许多 教科 书 的 主题 (例如 | Schwartz 1980] 或 | Bertsekas 1991]) ， 而 我 们 这 里 仅 讨论 
必要 内 容 。 我 们 此 时 的 目的 是 对 差错 检测 和 纠正 技术 提供 的 能 力 有 一 种 直观 的 认识 ， 并 看 
看 一 些 简 单 技术 在 链 路 层 中 的 工作 原理 及 其 如 何 实 际 应 用 。 

K 5-3 图 示 说 明了 我 们 研究 的 环境 。 在 发 送 结 点 ， 为 了 保护 比特 免 受 差错 ， 使 用 差 形 
检测 和 纠正 比特 (Error- Detection and- Correction, EDC) 来 增强 数据 D. 通常， 要 保护 的 
数据 不 仅 包 括 从 网 络 层 传递 下 来 需要 通过 链 路 传输 的 数据 报 ， 而 且 包 括 链 路 帧 首部 中 的 链 
路 级 的 寻 址 信息 、 序 号 和 其 他 字段 。 链 路 级 帧 中 的 已 和 E&DC 都 被 发 送 到 接收 结 点 。 在 接 
收 结 点 ， 接 收 到 比特 序列 D'A EDC’. 注意 到 央 传 输 中 的 比特 翻转 所 致 ， 忆 和 EDC 可 能 与 
初始 的 乙 和 EDC 不同. 
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易 出 现 比特 差错 的 链 路 
图 5$-3 差错 检测 与 纠正 的 场景 


接收 方 的 挑战 是 在 它 只 收 到 D' 和 EDC THO PF, Wiha D ERRA D HH] fE 
图 5-3 中 的 接收 方 判定 的 准确 措 词 (我 们 问 是 否 检 测 到 一 个 差错 ， 而 非 是 否 出 现 了 差错 1) 
是 重要 的 。 差 错 检 测 和 纠正 技术 使 接收 方 有 时 但 并 总 是 检测 出 已 经 出 现 的 比特 差 录 即使 
末 用 差错 检测 比特 ， 也 还 是 可 能 有 未 检 出 比特 差错 (undetected bit error); 这 就 是 说 ， 接 
收 方 可 能 无 法 知道 接收 的 信息 中 包含 着 比特 差错 。 因 此 ， 接 收 方 可 能 回 网 路 层 交 付 一 个 损 
伤 的 数据 报 ， 或 者 不 寺 道 该 帧 首部 的 茶 个 其 他 字段 的 内 容 已 经 损伤 .我 们 因此 要 选择 一 个 
差错 检测 方案 ， 使 得 这 种 事件 发 生 的 概率 很 小 .一般 而 言 ， 差 错 检测 和 纠 铺 技 术 越 复杂 
( 即 那些 具有 未 检测 出 比特 差错 概率 较 小 的 技术 ) ， 导 致 的 开销 就 越 大 ， 这 就 是 意味 着 调 要 
更 多 的 计算 量 及 更 多 的 差错 检测 和 纠 错 比 特 

我 们 现在 来 研究 在 传输 数据 中 检测 差错 的 3 种 技术 : 奇偶 校 验 ( 它 用 来 描述 差错 检测 
和 纠正 育 后 隐 含 的 基本 思想 ) 、 检 验 和 方法 ( 它 通 和 常 更 多 地 应 几 于 运输 层 ) 和 循环 元 余 检 
测 ( 它 通常 更 多 地 应 用 在 适 配 副 中 的 链 路 层 ) : 


5.2.1 奇偶 校 验 


也 许 差错 检测 最 简单 的 方式 就 是 用 单个 奇偶 校 验 位 (parity bit)。 假 设 在 图 5-4 中 要 发 
送 的 信息 D 有 da 个 比特 。 在 偶 校 验方 案 中 ， 发 送 方 只 ne pe 
需 包 含 一 个 附加 的 比特 ， 选 择 它 的 值 ， 使 得 这 4 + 1 一 一 一 一 一 一 一 - h 
个 比特 ( 初始 信息 加 上 一 个 校 验 比特 ) 中 1 的 总 数 是 oiro ooi rororo 1 
偶数 。 对 于 奇 校 验方 案 ， 选 择 校 验 比 特 值 使 得 有 奇数 ” 
个 1。 图 5-4 描述 了 一 个 偶 校 验 的 方案 ， 单 个 校 验 比 图 5-4 1 比特 偶 校 验 
特 被 存放 在 一 个 单独 的 字段 中 。 

采用 单个 奇偶 校 验 位 方式 ， 接 收 方 的 操作 也 很 简单 。 接 收 方 只 需要 数 一 数 接收 的 d+1 
比特 中 1 的 数目 即 可 。 如 果 在 采用 偶 校 验方 案 中 发 现 了 奇数 个 值 为 1 的 比特 ， 接 收 方 知道 
至 少 出 现 了 一 个 比特 差错 。 更 精确 的 说 法 是 ， 出 现 了 奇数 个 比特 差错 。 

但 是 如 果 出 现 了 偶数 个 比特 差错 ， 那 会 发 生 什么 现象 呢 ? 你 应 该 认识 到 这 将 导致 一 个 
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未 检 出 的 差错 。 如 果 比 特 差错 的 概率 小 ， 而 且 比 特 之 间 的 差错 可 以 被 看 作 是 独立 发 生 的 ， 
在 一 个 分 组 中 多 个 比特 同时 出 错 的 概率 将 是 极 小 的 。 在 这 种 情况 下 ， 单 个 奇偶 校 验 位 可 能 
是 足够 的 了 。 人 然而 ,测量 已 经 表明 了 差错 经 党 以 “ 突 发 ”方式 聚集 在 一 起 ， 而 不 是 独立 地 
RE. 在 突 发 差错 的 情况 下 ， 使 用 单 比特 奇偶 校 验 保护 的 一 帖 中 未 检测 出 差错 的 概率 能 够 
达到 50% | Spragins 1991]。 显 然 ,， 需要 一 个 更 健壮 的 差错 检测 方案 【( 辫 运 的 是 实践 中 正 
在 使 用 这 样 的 方式 1) 。 但 是 Ae IE EL EA RZ RATE EXE EL BF ay 
fH BSC FS — BP fen] LR — PTT SE, ORG SEF AT HS A e St RETR o 
加 5-5 显示 了 单 比特 奇偶 校 验 方案 的 二 维 一 般 化 方案 。 这 里 D 中 的 d 个 比特 被 划分 为 
i 行 ) 列 。 对 每 行 和 每 列 计算 奇偶 值 。 产 生 的 i+j+1 奇偶 比特 构成 了 链 路 层 帧 的 差错 检测 
比特 。 行 校 验 
ae an d 比特 信息 中 出 现 了 
单个 比特 差错 。 使 用 这 种 二 维 育 偶 校 验 
(two-dimensional parity) 方案 ， 包 含 比特 列 
值 改 变 的 列 和 行 的 校 验 值 都 将 会 出 现 差 % 
错 。 因 此 接收 方 不 仅 可 以 检测 到 出 现 了 单 
个 比特 差错 的 事实 ， 而 且 还 可 以 利用 存在 
奇偶 校 验 差错 的 列 和 行 的 索引 来 实际 识别 
发 生 差错 的 比特 并 纠正 它 ! 图 5-5 显示 了 
一 个 例子 ， 其 中 位 于 (2, 2) 的 值 为 1 的 无 差错 
比特 损坏 了， 变 成 了 0， 该 差错 就 是 一 个 
在 接收 方 可 检测 并 可 纠正 的 差错 。 尺 省 我 
们 的 讨论 是 针对 初始 d 比特 信息 的 ， 但 校 
验 比 特 本 号 的 单个 比特 差错 也 是 可 检测 和 
可 纠正 的 。 二 维 奇 偶 校 验 也 能 够 检测 (但 
不 能 纠正 !) 一 个 分 组 中 两 个 比特 差错 的 








任何 组 合 。 二 维 奇偶 校 验方 案 的 其 他 特性 校 验 错 
将 在 本 章 后 面 的 习题 中 进行 探讨 。 图 5-5 二 维 偶 校 验 


接收 方 检测 和 纠正 差错 的 能 力 被 称 为 前 向 纠 错 (Forward Error Correction, FEC), ix 
些 技术 通常 用 于 如 音频 CD 这 样 的 音频 存储 和 回放 设备 中 。 在 网 络 环境 中 ，FEC 技术 可 以 
单独 应 用 ， 或 与 链 路 层 ARQ 技术 一 起 应 用 ，ARQ 技术 与 我 们 在 第 3 章 研 究 的 协议 类 似 。 
FEC 技术 很 有 价值 ， 因 为 它们 可 以 减少 所 需 的 发 送 方 重 发 的 次 数 。 也 许 更 为 重要 的 是 ， 它 
们 允许 在 接收 方 立即 纠正 差错 。FEC 避免 了 不 得 不 等 竺 的 往返 时 延 ， 而 这 些 时 延 是 发 送 方 
收 到 NAK 分 组 并 向 接收 方 重 传 分 组 所 需要 的 ， 这 对 于 实时 网 络 应 用 [Rubenstein 1998] 或 者 
具有 长 传播 时 延 的 链 路 ( 如 深 空 间 链 路 ) 可 能 是 一 种 非常 重要 的 优点 。 研 究 差错 控制 协议 中 
FEC 的 使 用 的 资料 包括 | Biersack 1992; Nonnenmacher 1998; Byers 1998; Shacham 1990 |. 


5.2.2 检验 和 方法 


在 检验 和 技术 中 ， 图 5-4 中 的 d 比特 数据 被 作为 一 个 比特 整数 的 序列 处 理 。 一 个 人 简 
单 检验 和 方法 就 是 将 这 上 比特 整数 加 起 来 ， 并且 用 得 到 的 和 作为 差错 检测 比特 。 因 特 网 检 
验 和 (Internet checksum) 就 基于 这 种 方法 ， 即 数据 的 字 节 作为 16 比特 的 整数 对 竺 并 求 
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和 。 这 个 和 的 反 码 形成 了 携带 在 报 文 段 首 部 的 因特网 检验 和 ， 如 在 3. 3 节 讨 论 的 那样 ， 接 
收 方 通过 对 接收 的 数据 (包括 检验 和 ) i ae 并 且 检 测 其 结果 是 否 为 全 1 比特 来 检 
测 检 验 和 。 如 果 这 些 比 特 中 有 任何 比特 是 0， 就 可 以 指示 出 差错 。RFC 1071 详细 地 讨论 因 
特 网 检验 和 算法 和 它 的 实现 。 在 TCP 和 UDP 协 以 中 ， 对 所 有 字段 (包括 首部 和 数据 字段 ) 
都 计算 因特网 检验 和 。 在 其 他 协议 中 ， 例 如 XTP [Strayer 1992], ， 对 首部 计算 一 个 检验 和 ， 
对 整个 分 组 计算 另 一 个 检验 和 

检验 和 方法 需要 相对 小 的 分 组 开销 ， 例 如 ，TCP 和 UDP 中 的 检验 和 只 用 了 16 比特 。 
然而 ,与 后 面 要 讨论 的 第 用 于 链 踏 层 的 CRC 相 比 ， 它 们 提供 相对 弱 的 差错 保护 ， 这 时 ， 
一 个 很 目 然 的 问题 是 : 为 什么 运输 层 使 用 检验 和 而 链 路 层 使 用 CRC We? 前 面 讲 过 运输 层 
通常 是 在 主机 中 作为 用 户 操作 系统 的 一 部 分 用 软件 实现 的 。 因 为 运输 层 差错 检测 用 软件 实 
现 ， 采 用 简单 而 快速 如 检验 和 这 样 的 差错 检测 方案 是 重要 的 。 在 另 一 方面 ， 链 路 层 的 差错 
检测 在 和 运 配 需 中 用 专用 的 人 硬件 实现 ， 它 能 够 快速 执行 更 复杂 的 CRC 操作 。Feldmeier[ Feld- 
meier 1995 | 描述 的 快速 软件 实现 技术 不 仅 可 用 于 加 权 检 验 和 编码 ， 而 且 可 用 于 CRC (UL 
后 面 ) 和 其 他 编 但 . 


5.2.3 循环 元 余 检 测 


现今 的 计算 机 网 络 中 广泛 应 用 的 差错 检测 技术 基于 循环 郊 余 检测 (Cyclic Redundancy 
Check, CRC) 编码 .CRC 编码 也 称 为 多 项 式 编码 (polynomial code) ， 因 为 该 编码 能 够 将 要 
发 送 的 比特 串 看 作为 系数 是 0 和 1 一 个 多 项 式 ， 对 比特 串 的 操作 被 解释 为 多 项 式 算 术 。 

CRC 编码 操作 如 下 ， 考 虑 d 比特 的 数据 D， 发 送 结 点 要 将 它 发 送 给 接收 结 点 。 发 送 方 
和 接收 方 自 和 完 必 须 协商 一 个 r+1 比特 模式 ， 称 为 生成 多 项 式 ( generator) ， 我 们 将 其 表示 


AG. 我们 将 要 求 G 的 最 高 有 效 位 的 比特 (最 左边 ) 是 1。CRC 编码 的 关键 思想 如 网 5-6 
所 示 。 对 于 一 个 给 定 的 数据 段 D， 发 送 方 要 选择 + 个 附加 比特 R， 并 将 它们 附加 到 D 上， 
使 得 得 到 的 d +r 比特 模式 EREA — a d 比 特 "比特 

二 进 制 数 ) 用 模 2 算术 恰好 能 被 C6 整 除 a 

( 即 没 有 余数 ) 。 用 CRC 进行 差错 检测 的 过 R: CRC 比 特 





程 因此 很 简单 : 接收 方 用 6 去 除 接 收 到 的 
d+r 比 特 。 如 果 余 数 为 非 零 ， 接 收 方 知道 
HATZ 否则 认为 数据 正确 而 被 接收 . 

所 有 CRC 计算 采用 模 2 算术 来 做 ， 在 加 法 中 不 进位 ， 在 减法 中 不 借 位 。 这 意味 着 加 
法 和 减法 是 相同 的 ， 而 且 这 两 种 操作 等 价 于 操作 数 的 按 位 异 或 (XOR) 。 因 此 ， 举 例 来 说 : 

1011 XOR 0101 =1110 

1001 XOR 1101 =0100 

1011 -0101 =1110 

1001 - 1101 =0100 

除了 所 需 的 加 法 或 减法 操作 没有 进位 或 借 位 外 ， 乘 法 和 除法 与 在 二 进 制 算术 中 是 相同 
的 。 如 在 通常 的 二 进 制 算术 中 那样 ， 乘 以 2 就 是 以 一 种 比特 模式 左 移 大 个 位 置 。 这 样 ， 给 
E D AIR, D+ 2'XORR 产生 如 图 5-6 所 示 的 d+r 比特 模式 。 在 下 面 的 讨论 中 ， 我 们 将 利用 
图 5-6 中 这 种 d +r 比特 模式 的 代数 特性 . 
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现在 我 们 回 到 发 送 方 怎样 计算 R 这 个 关键 问题 上 来 。 前 面 讲 过 ， 我 们 要 求 出 R 使 得 对 
Tam: a ae 1o1old 
D+2' XOR R = nG | 














也 就 是 说 ， 我 们 要 选择 R 使 得 6 HENS RL D x 2™XOR R 人 A 
而 没有 余数 。 如 果 我 们 对 上 述 等 式 的 两 边 都 用 RR 异 或 ( 即 ny 
用 模 2 加 ， 而 没有 进位 ) ， 我 们 得 到 Ti 
D+2" = nG XOR R i001 
这 个 等 式 告诉 我 们 ， 如 果 我 们 用 G 来 除 D .2 ,余数 
全 刚好 是 民 。 换 句 话 说， 我 们 可 以 这 样 计算 R: 1100 
| E 1001 
R = remainder C loll 
图 5-7 举例 说 明了 在 D =101110, d=6, G=1001 和 —— 
r =3 的 情况 下 的 计算 过 程 。 在 这 种 情况 下 传输 的 9 个 比特 N 


是 101110011。 你 应 该 自行 检查 一 下 这 些 计 算 ， 并 核对 一 下 
D +2" =101011 - G XOR R 的 确 成 立 。 

国际 标准 已 经 定义 了 8、12 、16 和 32 比特 生成 多 项 式 CG, CRC-32 32 比特 的 标准 被 多 
种 链 路 级 IEEE 协议 采用 ， 使 用 的 一 个 生成 多 项 式 是 : 

Gerec.» =100000100110000010001110110110111 

每 个 CRC 标准 都 能 检测 小 于 r+1 比特 的 突 发 差错 。( 这 意味 着 所 有 连续 的 r 比特 或 者 
更 少 的 差错 都 可 以 检测 到 ,) 此 外 ， 在 适当 的 假设 下 ， 长 度 大 于 r+1 比特 的 突 发 差错 以 概 
率 1 -0.5' 被 检测 到 。 每 个 CRC 标准 也 都 能 检测 任何 奇数 个 比特 差错 。 有 关 CRC 检测 实 
现 的 讨论 可 参见 [Williams 1993 ] 。CRC 编码 甚至 更 强 的 编码 所 依据 的 理论 超出 了 本 书 的 
范围 。 教 科 书 [| Schwartz 1980] 对 这 个 主题 提供 了 很 好 的 介绍 ， 


5.3 多 路 访问 链 路 和 协议 


在 本 章 概述 中 ， 我 们 提 到 了 有 两 种 类 型 的 网 络 链 路 : 点 对 点 链 路 和 广播 链 路 。 上 点 对 点 
链 路 (point-to-point link) 由 链 路 一 端的 单个 发 送 方 和 链 路 另 一 端的 单个 接收 方 组 成 。 许 
多 链 路 层 协议 都 是 为 点 对 点 链 路 设计 的 ， 如 点 对 点 协议 (point-to-point protocol, PPP) 和 
高 级 数据 链 路 控制 (high-level data link control, HDLC) 就 是 两 种 这 样 的 协议 ， 我 们 将 在 
本 草 后 面 涉 及 它们 。 第 二 种 类 型 的 链 路 是 广播 链 路 (broadcast link ) ， 它 能 够 让 多 个 发 送 
和 接收 结 点 都 连接 到 相同 的 、 单 一 的 、 共 享 的 广播 信道 上 。 这 里 使 用 术语 “广播 ”是 因为 
当 任 何 一 个 结 点 传输 一 个 帧 时 ， 信 道 广 播 该 帧 ， 每 个 其 他 绪 点 都 收 到 一 个 副本 。 以 太 网 和 
无 线 局 域 网 是 广播 链 路 层 技术 的 例子 。 在 本 节 ， 我 们 暂缓 讨论 特定 的 链 路 层 协 议 ， 而 先 研 
究 一 个 对 链 路 层 很 重要 的 问题 ， 如 何 协调 多 个 发 送 和 接收 结 点 对 一 个 共 至 广播 信和 过 的 访 
问 ， 这 就 是 多 路 访问 问题 (multiple access problem ) ,广播 信道 通常 用 于 局 域 网 中 ， 局 域 网 
是 一 个 地 理 上 集中 在 一 座 建 筑 物 中 (或 者 在 一 个 公司 ,或 者 在 大 学 校园 ) 的 网 络 。 因 此 我 
们 还 将 在 本 节 后 面 考察 一 下 多 路 访问 信道 是 如 何在 局 域 网 中 使 用 的 ， 

我 们 都 很 熟悉 广播 的 概念 ， 因 为 日 电视 发 明 以 来 就 使 用 了 这 种 通信 方式 。 但 是 传统 的 
电视 是 一 种 一 个 方 问 的 广播 ( 即 一 个 固定 的 结 点 回 许 多 接收 结 和 点 传输 )， 而 计算 机 网 络 广 


图 $-7 一 个 简单 的 CRC 计算 
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播 信道 上 的 结 点 既 能 够 发 送 也 能 够 接收 也许 对 广播 信道 的 一 个 更 有 人 情 味 的 类 比 是 鸡 尾 
酒会 ， 在 那里 许多 人 聚集 在 一 个 大 房间 里 (空气 为 提供 广播 的 媒体 ) 谈论 和 倾听 。 第 二 个 
团 题 的 类 比 是 许多 读者 都 很 熟悉 的 地 方 ， 即 一 间 教 室 ， 在 那里 老师 们 和 同学 们 同样 共享 相 
同 的 、 单 一 的 广播 媒体 。 在 这 两 种 场景 下 ， 一 个 中 心 问题 是 确定 谁 以 及 在 什么 时 候 获 得 说 
话 权 力 (也 就 是 向 信道 传输 )， 作 为 人 类 ， 为 了 共享 这 种 广播 信道 ， 我 们 已 经 演化 得 到 了 
-个 精心 设计 的 协 以 集 卫 : 

“给 每 个 人 一 个 讲话 的 机 会 。 

“该 你 讲话 时 你 才 说 话 。 

“不 要 一 个 人 独占 整个 谈话 ," 

“如 果 有 问题 请 举 手 .” 

“ 当 有 人 讲话 时 不 要 打 断 .” 

“ 当 其 他 人 讲话 时 不 要 睡觉 .” 

计算 机 网 络 有 类 似 的 协议 ， 也 就 是 所 谓 的 多 路 访问 协议 (multiple access protocol) Bp 
结 点 通过 这 些 协议 来 规范 它们 在 共享 的 广播 信道 上 的 传输 行为 ， 如 图 5-8 所 示 ， 在 各 种 各 
样 的 网 络 坏 境 下 需要 多 路 访问 协议 ， 包括 有 线 和 无 线 接 入 网 ， 以 及 卫星 网 络 。 尺 管 从 技术 


上 讲 每 个 结 点 通过 它 的 适 配 需 访问 广播 信道 但 在 本 节 中 我 们 将 把 结 点 作为 发 送 和 接收 设 
备 ， 在 实践 中 ， 数 以 百 计 或 者 甚至 数 以 千 计 个 结 点 能 够 通过 一 个 广播 信道 直接 通信 
有 线 共 享 无 线 共享 


(例如 电缆 接 入 网 ，) (例如 WiFi) 





卫星 鸡尾酒 会 


> | OP is sa D 


闲话 Ms 


+ x Qe 


图 5-8 多 种 多 路 访问 信道 


因为 所 有 的 结 点 都 能 够 传输 帧 ， 所 以 多 个 结 点 可 能 会 同时 传输 帧 。 当 发 生 这 种 情况 
时 ， 所 有 结 点 同时 接 到 多 个 帧 ; 这 就 是 次 ， 传 输 的 帧 在 所 有 的 接收 方 处 碰撞 (collide ) 
了 。 通 带 ， 当 碰撞 发 生 时 ， 没 有 一 个 接收 结 点 能 够 有 效 地 获得 任何 传输 的 帧 ; 在 某 种 意义 
下 ,碰撞 帧 的 信号 纠缠 在 一 起 。 因 此 ， 涉 及 此 次 碰撞 的 所 有 帧 莉 丢 失 广 ， 在 碰撞 时 间 间 隐 
中 的 广播 信道 被 浪费 了 -。 显然. 如 果 许 多 结 点 要 频 索 地 传输 帧 ， 许 多 传输 将 导致 健 撞 ， 广 
播 信道 的 大 量 牢 宽 将 被 浪费 掉 。 

当 多 个 结 点 处 于 活跃 状态 时 ， 为 了 确保 广播 信道 执行 有 用 的 工作 ， 以 某 种 方式 协调 活 
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跃 结 点 的 传输 是 必要 的 。 这 种 协调 工作 由 多 路 访问 协议 负责 。 在 过 去 的 40 年 中 , 已 经 有 
上 千 篇 文 昔 和 上 百 入 博士 论文 研究 过 多 路 访问 协议 ; 有 关 这 部 分 工作 前 20 年 来 的 一 个 内 
容 丰 富 的 综述 见 [Rom 1990 ]。 此 外 ， 由 于 新 类 型 链 路 尤其 是 新 的 无 线 链 路 不 断 出 现 ， 在 
多 路 访问 协议 方面 研究 的 活跃 状况 仍 在 继续 。 

这 些 年 来 ， 在 大 量 的 链 路 层 技 术 中 已 经 实现 了 几 十 种 多 路 访问 协议 。 尽 管 如 此 ， 我 们 能 
人 够 将 任何 多 路 访问 协议 划分 为 3 种 类 型 之 一 : 信道 划分 协议 (channel partitioning protocol ) , 
随机 接 入 协议 (random access protocol) 和 轮流 协议 (taking-turns protocol). PATHET EE 
的 3 个 小 三 中 讨论 这 几 类 多 路 访问 协议 。 

在 结束 概述 之 前 ， 我 们 给 出 下 列 条 件 。 在 理想 情况 下 ， 对 于 速率 为 R bps 的 广播 信 
过， 多 路 访问 协议 应 该 具有 以 下 所 希望 的 特性 : 

1 ) 当 仅 有 一 个 结 点 有 数据 发 送 时 ， 该 结 点 具有 R bps WEILE; 

2) 当 有 杂 个 结 点 要 发 送 数据 时 ， 每 个 结 点 吞吐 量 为 RAM bps。 这 不 必要 求 M 结 点 中 
的 每 一 个 结 点 总 是 有 R/M 的 瞬间 速率 ， 而 是 每 个 结 点 在 一 些 适 当 定 义 的 时 间 间 隔 内 应 该 
有 R/M 的 平均 传输 速率 。 

3) 协议 是 分 散 的 ; 这 就 是 说 不 会 因 某 主 结 点 故障 而 使 整个 系统 有 衣 湿 。 

4) 协议 是 简单 的 ， 使 实现 不 昂 贯 。 


5.3.1 信道 划分 协议 


我 们 前 面 在 1.3 条 讨论 过 ， 时 分 多 路 复 用 (TDM) 和 频 分 多 路 复 用 (FDM) 是 两 种 
能 够 用 于 在 所 有 共享 信道 结 点 之 间 划 分 广播 信道 市 宽 的 技术 。 举 例 来 说 ， 假 设 一 个 文 持 入 
个 结 点 的 信道 且 信 道 的 传输 速率 为 R bps。TDM 将 时 间 划 分 为 时 间 帧 (time frame) ， 并 进 
一 步 划 分 每 个 时 间 帆 为 N 个 时 隙 (slot)。( 不 应 当 把 TDM 时 间 帧 与 在 发 送 和 接收 适 配 带 之 
间 交 换 的 链 路 层 数 据 单元 相 混 消 ， 后 者 也 被 称 为 帧 。 为 了 减少 混乱 ， 在 本 小 节 中 我 们 将 链 
路 层 交 换 的 数据 单元 称 为 分 组 .) 然后 把 每 个 时 际 分 配给 NN 个 结 点 中 的 一 个 。 无 论 何 时 某 


个 结 点 在 有 分 组 要 发 送 的 时 候 ， 它 在 循环 的 TDM 帧 中 指派 给 它 的 时 际 内 传输 分 组 比特 。 
通常 ， 选 择 的 时 际 长 度 应 使 一 个 时 际 内 能 够 传输 单个 分 组 。 图 5-9 表示 一 个 简单 的 4 个 结 
点 的 TDM 例子 。 再 回 到 我 们 的 鸡尾酒 会 = 


类 比 中 ， 一 个 采用 TDM 规则 的 鸡尾酒 会 
将 允许 每 个 聚会 客人 在 固定 的 时 间 段 发 
言 ， 然 后 再 允许 为 一 个 聚会 客人 发 言 同 
样 时 长 ， 以 此 类 推 。 一 旦 每 个 人 都 有 了 
说 话机 会 ， 将 不 断 重复 着 这 种 模式 。 
TDM 是 有 吸引 力 的 ， 因 为 它 消除 了 
碰撞 而 且 非 第 公平 : 每 个 结 点 在 每 个 帧 
时 间 内 得 到 了 专用 的 传输 速率 RAN bps, 


4kHz 4 
L 





然而 它 有 两 个 主要 和 缺陷。 首先 ， 结 点 被 

限制 于 RAN bps 的 平均 速率 ， 即 使 当 它 是 图 例 : 

唯一 有 分 组 要 发 送 的 结 点 时 。 其 次 ， 结 p “2” 的 所 有 时 阶 专用 于 
一 个 特定 的 发 送 方 -接收 方 对 。 


点 必须 总 是 等 待 它 在 传输 序列 中 的 轮 次 ， 
即 我 们 再 次 看 到 ， 即 使 它 是 唯一 一 个 有 图 5-9 一 个 4 结 点 的 TDM 与 FDM 的 例子 
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帧 要 发 送 的 结 点 。 想 象 一 下 某 聚 会 客人 是 唯一 一 个 有 话 要 说 的 人 的 情形 (并 且 想 象 一 下 这 
种 十 分 罕见 的 情况 ， 即 酒会 上 所 有 的 人 者 想 听 某 一 个 人 说 话 ) 。 显 然 ， 一 种 多 路 访问 协议 
用 于 这 个 特殊 聚会 时 ，TDM 是 一 种 很 糟 的 选择 。 

TDM 在 时 间 上 共享 广播 信道 ， 而 FDM 将 R bps 信道 划分 为 不 同 的 频段 (每 个 频段 有 具 
有 RAN 带宽 )， 并 把 每 个 频率 分 配给 NN 个 结 点 中 的 一 个 。 因 此 FDM 在 单个 较 大 的 R bps 信 
道中 创建 了 NN 个 较 小 的 RAN bps 信道 。FDM 也 有 TDM 同样 的 优点 和 缺点 。 它 避免 了 碰撞 ， 
在 N 个 结 点 之 间 公 平地 划分 了 带宽 。 然 而 ，FDM 也 有 TDM 所 具有 的 主要 和 缺点， 也 就 是 限 
制 一 个 结 点 只 能 使 用 RAN 的 带宽 ， 即 使 当 它 是 唯一 一 个 有 分 组 要 发 送 的 结 点 时 。 

第 三 种 信道 划分 协 以 是 码 分 多 址 (Code Division Multiple Access, CDMA), TDM 和 
FDM 分 别 为 结 点 分 配 时 院 和 频率 ， 而 CDMA 对 每 个 结 点 分 配 一 种 不 同 的 编码 。 然 后 每 个 
结 点 用 它 唯一 的 编码 来 对 它 发 送 的 数据 进行 编码 。 如 果 精 心 选择 这 些 编码 ，CDMA 网 络 具 
有 一 种 奇妙 的 特性 ， 即 不 同 的 绪 点 能 够 同时 传输 ， 并 且 它 们 各 上 自 相 应 的 接收 方 仍 能 正确 接 
收发 送 方 编码 的 数据 比特 〈 假 设 接收 方 知道 发 送 方 的 编码 ) ， 而 不 在 乎 其 他 结 点 的 干扰 传 
输 。CDMA 已 经 在 军用 系统 中 使 用 了 一 段 时 间 (由 于 它 的 抗 干扰 特性 ) ， 目 前 已 经 广泛 地 
用 于 民用 ， 尤 其 是 蜂窝 电话 中 。 因 为 CDMA 的 使 用 与 无 线 信道 紧密 相关 ， 所 以 我 们 将 把 有 
X CDMA 技术 细节 的 讨论 留 到 第 6 章 。 此 时 ， 我们 知道 CDMA 编码 类 似 于 TDM 中 的 时 际 
和 FDM 中 的 频率 ， 能 分 配给 多 路 访问 信道 的 用 户 就 可 以 了 - 


5.3.2 随机 接 入 协议 


第 二 大 类 多 访问 协议 是 随机 接 入 协议 。 在 随机 接 入 协议 中 ， 一 个 传输 结 点 总 是 以 信道 
的 全 部 速率 (BIR bps) 进行 发 送 。 当 有 碰撞 时 ， 涉 及 碰撞 的 每 个 结 点 反复 地 重 发 它 的 帧 
(也 就 是 分 组 ) ， 到 该 帧 无 碰撞 地 通过 为 止 。 但 是 当 一 个 结 点 经 历 一 次 碰撞 时 ， 它 不 必 立 刻 
重 发 该 帧 。 相 反 ， 它 在 重 发 该 帧 之 前 等 待 一 个 随机 时 延 。 涉及 碰撞 的 每 个 结 点 独立 地 选择 
随机 时 延 。 因 为 该 随机 时 延 是 独立 地 选择 的 ， 所 以 下 述 现象 是 有 可 能 的 : 这 些 结 点 之 一 所 
选择 的 时 延 充分 小 于 其 他 碰撞 结 点 的 时 延 ， 并 因此 能 够 无 碰撞 地 将 它 的 帧 在 信道 中 发 出 。 

文献 中 描述 的 随机 接 人 协议 即使 没有 上 百 种 也 有 几 十 种 [Rom 1990; Bertsekas 
1991 ] 。 在 本 节 中 ， 我 们 将 描述 一 些 最 稼 用 的 随机 接 人 协议， 即 ALOHA 协议 [ Abramson 
1970; Abramson 1985; Abramson 2009 | 和 载波 侦 听 多 路 访问 (CSMA) 协议 | Kleinrock 
1975b] 。 以 太 网 [Metcalfe 1976} 是 一 种 流行 并 广泛 部 署 的 CSMA 协议 。 

1. HEBER ALOHA 

我 们 以 最 简单 的 随机 接 入 协议 之 一 一 一 时 际 ALOHA 协议 ， 开 始 我 们 对 随机 技 入 协议 
的 学 习 。 在 对 时 阶 ALOHA 的 描述 中 ， 我 们 做 下 列 假设 : 

e HA Wih L 比特 组 成 。 

o 时 间 被 划分 成 长 度 为 LAR POAT BR (这 就 是 说 ， 一 个 时 际 等 于 传输 一 帧 的 时 间 ) 。 

o 结 点 只 在 时 际 起 点 开始 传输 帧 。 

e 结 点 是 同步 的 ， 每 个 结 点 都 知道 时 际 何 时 开始 。 

e 如 果 在 一 个 时 际 中 有 两 个 或 者 更 多 个 帧 碰撞 ， 则 所 有 结 点 在 该 时 际 结束 之 前 检测 

到 该 碰撞 事件 . 
令 p 是 一 个 概率 ， 即 一 个 在 0 和 1 之 间 的 数 。 在 每 个 结 点 中 ， 时 辽 ALOHA 的 操作 是 
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hal FLAY : 
e 当 结 点 有 一 个 新 帧 要 发 送 时 ， 它 等 到 下 一 个 时 除开 始 并 在 该 时 院 传 输 整 个 帧 。 
© 如 有 果 没 有 碰撞 ， 该 结 点 成 功 地 传输 它 的 帧 从 而 不 需要 考虑 重 传 该 帧 。( 如 果 该 结 
点 有 新 帧 ， 它 能 够 为 传输 准备 一 个 新 帧 . ) 
e 如 果 有 碰撞 ， 该 结 点 在 时 际 结束 之 前 检测 到 这 次 碰撞 。 该 结 点 以 慨 率 p 在 后 续 的 
每 个 时 院 中 重 传 它 的 帧 ， 直 到 该 帧 被 无 碰撞 地 传输 出 去 。 
我 们 说 以 概率 p 重 传 ， 是 指 某 结 点 有 效 地 投 措 一 个 有 偏 倚 的 便 币 ; 便 币 正面 事件 对 应 
着 重 传 ， 而 重 传 出 现 的 概率 为 pp。 人 硬币 反面 事件 对 应 着 “ 跳 过 这 个 时 际 ， 在 下 个 时 辽 再 掷 
人 硬币”; 这 个 事件 以 概率 (1 —p) 出 现 。 所 有 涉及 碰撞 的 结 点 独立 地 投掷 它们 的 人 硬币 。 
时 际 ALOHA 看 起 来 有 很 多 优点 。 与 信道 划分 不 同 ， 当 某 结 点 是 唯一 活跃 的 结 点 时 
(一 个 结 点 如 果 有 帧 要 发 送 就 认为 它 是 活跃 的 )， 时 际 ALOHA 允许 该 结 点 以 全 速 尺 连续 传 
输 。 时 际 ALOHA 也 是 高 度 分 散 的 ， 因 为 每 个 结 点 检测 碰撞 并 独立 地 决定 什么 时 候 重 传 。 
(Ai, WY BR ALOHA 的 确 需要 在 结 点 中 对 时 际 同 步 ; 我 们 很 快 将 讨论 ALOHA 协议 的 一 个 
不 分 时 际 的 版 本 以 及 CSMA 协议 ， 这 两 种 协议 部 不 需要 这 种 同步 .) 时 际 ALOHA 也 是 一 
个 极为 简单 的 协议 。 
当 只 有 一 个 活跃 结 点 时 ， 时 际 ALOHA 工作 出 色 ， 但 是 当 有 多 个 活跃 结 点 时 效率 又 将 
如 何 呢 ? 这 里 有 两 个 可 能 要 考虑 的 效率 问题 。 首先 ， 如 在 图 5-10 中 所 示 ， 当 有 多 个 活跃 
结 点 时 ， 一 部 分 时 际 将 有 碰撞， 因此 将 被 “浪费 ” 掉 了 ,第 二 个 考虑 是 ， 时 际 的 男 一 部 分 


将 是 空闲 的 ， 因 为 所 有 活跃 结 点 由 于 概率 传输 策略 会 节制 传输 。 唯 一 “未 浪费 的 ”时 隙 是 那 
些 刚 好 有 一 个 结 点 传输 的 时 际 。 刚 好 有 一 个 结 点 传输 的 时 际 称 为 一 个 成 功 时 孙 (successful 


slot) 。 时 际 多 路 访问 协议 的 效率 (efficiency) 定义 为 : 当 有 大 量 的 活跃 结 点 且 每 个 结 点 总 
有 大 量 的 帆 要 发 送 时 ， 长 期 运行 中 成 功 时 际 的 份额 。 注 意 到 如 果 不 使 用 某 种 形式 的 访问 控 
制 ， 而 且 每 个 结 点 都 在 每 次 碰撞 之 后 立即 重 传 ， 这 个 效率 将 为 零 。 时 际 ALOHA 显然 增加 
了 它 的 效率 ， 使 之 大 于 零 ， 但 是 效率 增加 了 多 少 呢 ? 
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结 点 2 2 
图 例 : 

C= File PSN Bat 

E= 空 闲 时 隐 

S= 成 功 时 隐 


图 5$-10 结 点 1、2 和 3 在 第 一 个 时 陀 碰 撞 。 结 点 2 最 终 在 第 4 个 时 际 

成 功 ， 结 点 1 在 第 8 个 时 隙 成 功 ， 结 点 3 在 第 9 个 时 际 成 功 
现在 我 们 继续 概要 讨论 时 际 ALOHA 最 大 效率 的 推导 过 程 。 为 了 保持 该 推导 简单 ， 我 
们 对 协议 做 了 一 点 修改 ,假设 每 个 结 点 试图 在 每 个 时 际 以 概率 p 传输 一 帧 。 (这 就 是 说 ， 
我 们 假设 每 个 结 点 总 有 帧 要 发 送 ， 而 且 结 点 对 新 帧 和 已 经 经 历 一 次 碰撞 的 帧 都 以 概率 p 传 
输 。) 假设 有 WN 个 结 点 。 则 一 个 给 定时 际 是 成 功 时 际 的 概率 为 结 点 之 一 传输 而 余下 的 -1 
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个 结 点 不 传输 的 概率 。 一 个 给 定 结 点 传输 的 概率 是 p; 剩余 结 点 不 传输 的 概率 是 (1 -p) ” 。 
因此 ,一 个 给 定 结 点 成 功 传送 的 概率 是 p(1 - p)”” 。 因 为 有 NN 个 结 点 ,任意 一 个 结 点 成 
功 传送 的 概率 是 Np(1 =- p). 

因此 ， 当 有 AN 个 活跃 结 点 时 ， 时 际 ALOHA 的 效率 是 Np(1 -p) ”。 为 了 获得 NN 个 活 


跃 结 点 的 最 大 效率 ， 我 们 必须 求 出 使 这 个 表达 式 最 大 化 的 p”。( 对 这 个 推导 的 一 个 大 体 描 
述 参 见 课 后 习题 .) 而 且 对 于 大 量 活跃 结 点 ， 为 了 获得 最 大 效率 ， 当 WN 趋 于 无 穷 时 ， 我们 
He Np’ (1 一 p") ”的 极限 。( 同 样 参见 课 后 习题 .) 在 完成 这 些 计算 之 后 ， 我 们 会 发 现 这 个 
协议 的 最 大 效率 为 1/e =0.37, 这 就 是 说 ， 当 有 大 量 结 点 有 很 多 帧 要 传输 时 ， 则 (最 多 ) 
仅 有 375 的 时 际 做 有 用 的 工作 .因此 该 信道 有 效 传输 速率 不 是 尺 bps， 而 仅 为 0. 37R bps! 
相似 的 分 析 还 表明 37% 的 时 际 是 空 闻 的 ，26% 的 时 隙 有 碰撞 。 试 想 一 个 整 脚 的 网 络 管理 员 
购买 了 一 个 100Mbps 的 时 际 ALOHA 系统 ,希望 能 够 使 用 网 络 在 大 量 的 用 户 之 间 以 总 计 速 
率 如 80Mbps 来 传输 数据 。 尽 管 这 个 信道 能 够 以 信道 的 全 速 100Mbps 传输 一 个 给 定 的 帧 ， 
但 从 长 时 间 范 围 看 ， 该 信道 的 成 功 否 吐 量 将 小 于 37Mbps。 

2. ALOHA 

时 院 ALOHA 协议 要 求 所 有 的 结 点 同步 它们 的 传输 ， 以 在 每 个 时 隙 开始 时 开始 传输 。 第 
一 个 ALOHA 协议 | Abramson 1970] 实际 上 是 一 个 非 时 际 、 完 全 分 散 的 协议 。 在 纯 ALOHA 
中 ， 当 一 帧 首次 到 达 ( 即 一 个 网 络 层 数 据 报 在 发 送 结 点 从 网 络 层 传 递 下 来 )， 结 点 立刻 将 该 
帧 完整 地 传输 进 广播 信道 。 如 果 一 个 传输 的 帧 与 一 个 或 多 个 传输 经 历 了 碰撞 ， 这 个 结 点 将 立 
即 〈 在 完全 传输 完 它 的 碰撞 帧 之 后 ) 以 概率 疡 重 传 该 帧 。 和 否则， 该 结 点 等 待 一 个 帧 传输 时 间 。 
在 此 等 待 之 后 ， 它 则 以 概率 p 传输 该 帧 ， 或 者 以 概率 1 -p 在 另 一 个 帧 时 间 等 待 (保持 空闲 ) 。 

为 了 确定 纯 ALOHA 的 最 大 效率 ,我 们 关注 某 个 单独 的 结 点 。 我 们 的 假设 与 在 时 际 
ALOHA 分 析 中 所 做 的 相同 ， 取 帧 传输 时 间 为 时 间 单 元 。 在 任何 给 定时 间 ， 某 结 点 传输 一 
个 帧 的 概率 是 p。 假 设 该 帧 在 时 刻 to 开始 传输 。 如 在 图 5-11 中 所 示 ， 为 了 使 这 帧 能 成 功 地 
传输 ， 在 时 间 间 阳 Lt,。-1，to」 中 不 能 有 其 他 结 点 开始 传输 。 这 种 传输 将 与 结 点 i Me 
输 起 始 部 分 相 重 羡 。 所 有 其 他 结 点 在 这 个 时 间 间 隔 不 开始 传输 的 概率 是 (1 - p) o KW 
地 ， 当 结 点 i 在 传输 时 ， 其 他 结 点 不 能 开始 传输 ， 因 为 这 种 传输 将 与 结 点 i 传输 的 后 面部 
分 相 重 琶 。 所 有 其 他 结 点 在 这 个 时 间 间 隔 不 开始 传输 的 概率 也 是 (1 - p) ” ”。 因 此 ,一 个 
给 定 的 结 点 成 功 传输 一 次 的 概率 是 p(1 - pp)” a 通过 与 时 阶 ALOHA 情况 一 样 来 取 极 
限 ， 我 们 求 得 纯 ALOHA 协议 的 最 大 效率 仅 为 1/ (2e)， 这 刚好 是 时 际 ALOHA 的 一 半 。 这 
就 是 完全 分 散 的 ALOHA 协议 所 要 付出 的 代价 。 
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图 5-11 纯 ALOHA 中 的 干扰 传输 
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Norm Abramson 是 一 名 有 博士 学 位 的 工程 师 ， 对 冲浪 运动 很 有 激情 ， 而 且 对 分 组 交 
换 很 感 兴趣 -这些 兴 趣 的 结合 使 他 在 1969 年 到 了 夏威夷 大 学 。 夏威夷 是 由 许多 巨大 的 
岛屿 组 成 的 ， 安 装 和 运营 基于 陆地 的 网 络 是 困难 的 。 当 不 冲浪 的 时 候 ，Abramson 思考 如 
何 设计 一 种 在 无 线 信道 上 完成 分 组 交互 的 网 络 。 他 设计 的 网 络 有 一 个 中 心 主机 和 几 个 分 
散在 夏 威 丙 各 个 岛 上 的 二 级 结 点 。 该 网 络 有 两 个 信道 ， 每 个 信道 使 用 不 同 的 频段 。 下行 链 
路 信道 从 中 心 主机 向 二 级 主机 广播 分 组 ; 上 行 信 道 从 二 级 主机 向 中 心 主机 发 送 分 组 。 除 了 
发 送信 息 分 组 ， 中 心 主 机 还 在 下 行 信道 上 对 从 二 级 主机 成 功 接收 到 的 每 个 分 组 发 送 确认 . 

因为 二 级 主机 以 分 散 的 方式 传输 分 组 ， 在 上 行 信道 上 出 现 碰撞 是 不 可 避免 的 。 这 个 
观察 导致 Abramson 设计 了 如 本 章 所 描述 的 那 种 纯 ALOHA 协议 。 在 1970 年 ， 通 过 不 断 
从 ARPA 获得 的 资助 ，Abramson 将 他 的 ALOHAnet 与 ARPAnet 相连 ，Abramson 的 工作 是 
很 重要 的 ， 不 仅 因为 它 是 无 线 分 组 网 络 的 第 一 个 例子 ， 而 且 因为 它 激励 了 Bob Metcalfe. 
几 年 之 后 ，Metcalfe 修改 了 ALOHA 协议 ,创造 了 CSMA/CD 协议 和 以 太 网 局 域 网 . 


3. 载波 侦 听 多 路 访问 (CSMA) 
在 时 阶 和 纯 ALOHA 中 ， 一 个 结 点 传输 的 决定 独立 于 连接 到 这 个 广播 信道 上 的 其 他 结 
点 的 活动 。 特 别 是 ， 一 个 结 点 不 关心 在 它 开始 传输 时 是 否 有 其 他 结 点 碰巧 在 传输 ， 而 且 即 
使 有 另 一 个 结 点 开始 干扰 它 的 传输 也 不 会 停止 传输 。 在 我 们 的 鸡尾酒 会 类 比 中 ，ALOHA 
协议 非常 像 一 个 粗野 的 聚会 客人 ， 他 喉 喉 不 休 地 讲话 而 不 顾 是 否 其 他 人 在 说 话 。 作 为 人 
类 ,我 们 有 人 类 的 协议 ， 它 要 求 我 们 不 仅 要 更 为 礼貌 ， 而 且 在 谈话 中 要 减少 与 他 人 “ 碰 


撞 ” 的 时 间 ， 从 而 增加 我 们 谈话 中 交流 的 数据 量 。 有 具体 而 言 ， 有 礼 罗 的 人 类 谈话 有 两 个 重 
要 的 规则 : 


e 说 话 之 前 先 听 。 如 条 其 他 人 正在 说 话 ， 等 到 他 们 说 完 话 为 止 。 在 网 络 领 域 中 ， 这 
被 称 为 载波 侦 听 (carrier sensing) ， 即 一 个 结 点 在 传输 前 先 听 信道 、 如 采 来 目 另 一 
个 结 点 的 帧 正 向 信道 上 发 送 ， 结 点 则 等 待 直到 检测 到 一 小 段 时 间 没 有 传输 ， 然 后 
开始 传输 。 

© 如 果 与 他 人 同时 开始 说 话 ， 停 止 说 话 。 在 网 络 领 域 中 ， 这 被 称 为 碰撞 检测 colli- 

sion detection) ， 即 当 一 个 传 辆 结 点 在 传输 时 一 下 在 侦 听 此 信道 。 如 有 果 它 检测 到 男 
一 个 续 点 正在 传输 干扰 帧 ， 它 就 停止 传输 ， 在 重复 “ 侦 听 - 当空 闲 时 传输 ”循环 
之 前 等 竺 一段 随机 时 间 。 

这 两 个 规则 包含 在 载波 侦 听 多 路 访问 (Carrier Sense Multiple Access, CSMA) 和 具有 
碰撞 检测 的 CSMA( CSMA with Collision Detection, CSMA/CD) 协议 族 中 | Kleinrock 1975b; 
Metcalfe 1976; Lam 1980; Rom 1990 | 。 人 们 已 经 提出 了 CSMA 和 CSMA/CD 的 评 多 变种 。 
这 里 ， 我 们 将 考虑 一 些 CSMA 和 CSMA/CD 最 重要 的 和 基本 的 特性 。 

关于 CSMA 你 可 能 要 问 的 第 一 个 问题 是 ， 如 果 所 有 的 结 点 都 进行 载波 侦 听 了 ， 为 什么 
当初 会 发 生 碰撞 ? 毕 苋 ， 某 结 点 无 论 何 时 侦 听 到 另 一 个 结 点 在 传输 ， 它 都 会 停止 传输 。 对 
于 这 个 问题 的 答案 最 好 能 够 用 时 空 图 来 说 明 | Molle 1987]. K 5-12 显示 了 连接 到 一 个 线 
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状 广播 总 线 的 4 个 结 点 CAL B, C, D) 的 时 空 网 ， 横 轴 表 示 每 个 结 点 在 空间 的 位 置 ; DA 
轴 表 示 时 间 。 

在 时 刻 :。， 结 点 B 侦 听 到 信道 是 空闲 的 ， 因 为 当前 没有 其 他 结 点 在 传输 。 因 此 结 点 B 
Fint, WTE 播 媒体 在 两 个 方向 传播 它 的 比特 .图 5-12 中 B 的 比特 随 着 时 间 的 增 
加 向 下 传播 ， oa B 的 比特 沿 着 广播 媒体 传播 所 实 ~ pe Lee EAS (里 然 以 接近 光 
的 速度 )。 在 时 刻 t Ct, > ta), ZED 有 一 个 帧 要 发 送 ， 尽管 结 点 B 在 时 刻 4 正在 传输 ， 
但 B 传输 的 比特 et D， 因 此 D 在 4 侦 听 到 信道 空 内 ， 根 据 CSMA 协 以 ， 从 而 D FF 
始 传输 它 的 帧 。 一 个 短暂 的 时 间 之 后 ，B 的 传输 开始 在 D 干扰 D 的 传输 。 从 网 5S-12 中 可 
以 看 出 ， 显 然 广播 信道 的 端 到 端 信道 传播 时 延 (channel propagation delay) (信号 从 一 个 结 
点 传播 到 另 一 个 结 点 所 花费 的 时 间 ) 在 决定 其 性 能 方面 起 着 关键 的 作用 。 该 传播 时 延 越 
长 ， 载 波 侦 听 结 点 不 能 侦 昕 到 网 络 中 男 一 个 结 点 已 经 开始 传输 的 机 会 就 越 大 ， 

4. 具有 碰撞 榨 测 的 载波 侦 听 多 路 访问 (CSMA/CD) 

在 图 5-12 中 ， 绪 点 没有 进行 碰撞 检测 ; 即使 已 经 出 现 了 碰撞 ，B AI D phonies 
地 传输 它们 的 帧 。 当 某 结 点 执行 碰撞 检测 时 ， 一 旦 它 检测 到 碰撞 将 立即 停止 传输 ， 图 5-1 
表示 了 和 图 5-12 相同 的 情况 ， 只 是 这 两 个 结 总 在 检测 到 碰撞 后 很 短 的 时 间 内 部 放弃 了 ‘ 
们 的 传输 。 AA, TES PUT PP A ee Re), an AS fe i — POCA AY. CHO A 

SEEM TD) 损坏 的 帧 ， 将 有 助 于 改善 协议 的 性 能 
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碰撞 检测 /放弃 时 间 
时 间 时 间 时 间 时 间 
图 5-12 发 生 碰 撞 传输 的 两 个 CSMA 结 点 的 时 空 图 图 5-13 具有 碰撞 检测 的 CSMA 


在 分 析 CSMA/CD 协议 之 前 ， 我 们 现在 从 与 广播 信道 相连 的 适 配 需 (在 结 点 中 ) 的 角 
gered 已 的 运行 : 

) 适配器 从 网 络 层 一 条 获得 数据 报 ， 准 备 链 路 层 帧 ， 并 将 其 放 人 帧 适 配 吉 缓存 中 . 

a Un as Ac Ae OUT BA as 〈 即 无 信号 能 量 从 信道 进入 适 配 需 ) ， 它 开始 传输 帧 。 
在 男 一 方面， 如 果 适 配 必 侦 听 到 信道 正在 忙 ， 它 将 等 每， 直到 侦 听 到 没有 信号 能 量 时 才 开 
REE LUE 

3) EREN, wa aE Oe A te ee SRB E AE e a A o E E HE 


4) WR iC as E aE Pod TT AS ae BUR A ah a AY eS Ee , AE Me a EE 
了 该 帧 。 在 另 一 方面 ， 如 果 适 配器 在 传输 时 检测 到 来 自 其 他 适 配 融 的 信号 能 量 ， 它 中 止 传 
输 〈 即 它 停止 了 了 传输 帧 ) 。 

5) 中 止 传输 后 ， 适 配 带 等 待 一 个 随机 时 间 量 ， 然 后 返回 步骤 2，。 

等 待 一 个 随机 〈 而 不 是 固定 ) 的 时 间 量 的 需求 是 明确 的 一 一 如 果 两 个 结 点 同时 传输 
帧 ， 然 后 这 两 个 结 点 等 待 相同 固 定 的 时 间 量 ， 它 们 将 持续 碰撞 下 去 。 但 选择 随机 回 退 时 间 
的 时 间 间 隔 多 大 为 好 呢 ” 如 果 时 间 间 隔 大 而 碰撞 结 点 数量 小 ， 在 重复 “ 侦 听 - 当空 闲 时 传 
输 ” 的 步 又 前 ， 结 点 很 可 能 等 待 较 长 的 时 间 (使 信道 保持 空 亲 ) 。 在 另 一 方面 ， 如 果 时 间 
间隔 小 而 碰撞 结 点 数量 大 ， 很 可 能 选择 的 随机 值 将 几乎 相同 ， 传 输 结 点 将 再 次 碰撞 ， 我 们 
硕 望 时 间 间 隔 应 该 这 样 : 当 碰 撞 结 点 数量 较 少 时 ， 时 间 间 隔 较 短 ; 当 碰 撞 结 点 数量 较 大 
时 ， 时 间 间 隔 较 长 。 

用 于 以 太 网 以 及 DOCSIS 电缆 网 络 多 路 访问 协议 | DOCSIS 2011] 中 的 二 进 制 指数 后 
退 (binary exponential backoff) 算法 ,简练 地 解决 了 这 个 问题 。 特 别 是 ， 当 传输 一 个 给 定 
帧 时 ， 在 该 帧 经 历 了 一 连 串 的 次 碰撞 后 ， 结 点 随机 地 从 10，1，2, +5, 2° -1| 中 选择 
一 个 天 值 。 因此， 一 个 由 经历 的 碰撞 越 多 ，K 选择 的 间隔 越 大 。 对 于 以 太 网 ， 一 个 结 点 等 
待 的 实际 时 间 量 是 大. 512 比特 时 间 (EIAS 512 比特 进入 以 太 网 所 需 时 间 量 的 大 倍 ) on 
能 够 取 的 最 大 但 在 10 以 内 。 

我 们 看 一 个 例子 。 假 设 一 个 适 配 融 首 次 尝试 传输 一 个 帧 ， 并 在 传输 中 它 检 测 到 碰撞 。 
然后 该 结 点 以 概率 0. 5 选择 K =0， 以 概率 0.5 选择 K=1。 如 果 该 结 点 选择 K =0， 则 它 立 
即 开 始 侦 听 信道 。 如 果 这 个 适 配 需 选 择 K =1， 它 在 开始 “ 侦 听 - 当空 闲 时 传输 ”。 周 期 前 
等 待 512 比特 时 间 (例如 对 于 100Mbps 以 太 网 来 说 为 5. 12 毫秒 ) 。 在 第 2 次 碰撞 之 后 ， 从 
10, 1, 2, 3} 中 等 概率 地 选择 K, ER 3 次 碰撞 之 后 , 从 10, 1, 2, 3, 4, 5, 6, 7} 
中 等 概率 地 选择 天 。 在 10 次 或 更 多 次 碰撞 之 后 ， 从 10, 1, 2, =, 1023) 中 等 概率 地 选 
择 天 。 因 此 从 中 选择 天 的 集合 长 度 随 着 碰撞 次 数 呈 指数 增长 ; 正 是 由 于 这 个 原因 ， 该 算法 
被 称 为 二 进 制 指数 后 退 。 

这 里 我 们 还 要 注意 到 ， 每 次 适 配 带 准备 传输 一 个 新 的 帧 时 ， 它 要 运行 CSMA/CD 算 
法 。 不 考虑 近期 过 去 的 时 间 内 可 能 已 经 发 生 的 任何 碰撞 。 因 此 ， 当 几 个 其 他 适 配 硕 处 于 指 
数 后 退 状 态 时 ， 有 可 能 一 个 具有 新 帧 的 结 点 能 够 立刻 搬入 一 次 成 功 的 传输 。 

5. CSMA/CD 效率 

当 只 有 一 个 结 点 有 一 个 帧 发 送 时 ， 该 结 点 能 够 以 信道 全 速率 进行 传输 (例如 10Mbps、 
100Mbps 或 者 1Cbps) 。 然 而 ， 如 果 很 多 结 点 都 有 帧 要 发 送 ， 信 道 的 有 效 传输 速率 可 能 会 小 
得 多 .我 们 将 CSMA/CD 效率 (efficiency of CSMA/CD) 定义 为 : SAR HAYTER AG, 
且 每 个 结 点 有 大 量 的 帧 要 发 送 时 ， 帧 在 信道 中 无 碰撞 地 传输 的 那 部 分 时 间 在 长 期 运行 时 间 
中 所 占 的 份额 。 为 了 给 出 效率 的 一 个 闭 式 的 近似 表示 ， 令 di 表示 信和 号 能 量 在 任意 两 个 适 
Fac ais Z EERE hg RAK, diane 表示 传输 一 个 最 大 长 度 的 以 太 网 帧 的 时 间 (对 于 
lOMbps 的 以 太 网 ， 该 时 间 近 似 为 1.2 毫秒 )。CSMAZCD 效率 的 推导 超出 了 本 书 的 范 于 
( 见 [Lam 1980] 和 [Bertsekas 1991 ] ) 。 这 里 我 们 只 是 列 出 下 面 的 近似 式 : 

] 
效 举 = 145d, /4.. 


trans 
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从 这 个 公式 我 们 看 到 ， 当 dnp 接近 0 时 ， 效 率 接近 1. 这 和 我 们 的 直觉 相符 ， 如 果 传 
播 时 延 是 0， 碰 撞 的 结 瑟 将 立即 中 止 而 不 会 浪费 信道 。 Srni 当 dean 变 得 很 大 时 ， 效 率 也 
接近 于 1。 这 也 和 百 觉 相符 ， 因 为 当 一 个 帧 取得 了 信道 时 ， 它 将 占有 信道 很 长 时 间 ; 因此 
信道 在 大 多 数 时 间 都 会 有 效 地 工作 ， 


5.3.3 轮流 协议 


前 面 讲 过 多 路 访问 协议 的 两 个 理想 特 Ln 上 D) 当 只 有 一 个 结 点 活跃 时 ， 该 活跃 结 点 具有 
R bps 的 吞吐 量 ; @ 当 有 W 个 结 点 活跃 时 ， eee i 跃 结 点 的 在 吐 量 接近 R/M bps, ALOHA 和 


CSMA 协议 具备 第 一 个 特性 ， 但 不 具备 第 二 个 特性 。 这 激发 研究 人 员 创 造 男 一 类 协议 ， 也 
Le Se IM (taking-turns protocol).。， 和 随机 接 入 协议 一 样 ， 有 几 十 种 轮流 协议 ， 其 中 每 
一 个 协议 又 部 有 很 多 变种 。 这 里 我 们 要 讨论 两 种 比较 重要 的 协议 。 第 一 种 是 轮 询 协 议 
(polling protocol)。 轮 询 协 议 婴 求 这 些 结 点 之 一 要 被 指定 为 主 结 点 。 主 结 点 以 循环 的 方式 





轮 询 (poll) 每 个 结 点 。 特别 是 ， 主 结 点 首先 向 结 点 1 发 送 一 个 报 文 ， 告 诉 它 ( 结 点 1) 
能 够 传输 的 帧 的 最 多 数量 ， 在 结 点 1 传输 了 某 些 帆 后 ， 主 结 点 告诉 结 点 2 它 ( 结 点 2) 能 够 
传输 的 帧 的 最 多 数量 ，( 主 结 点 能 够 通过 观察 在 信道 上 是 否 缺 乏 信 号 ， 来 决定 一 个 结 点 何 时 


TEIN SWAY AGE.) 上 述 过 程 以 这 种 方式 继续 进行 ， 主 结 点 ads 的 方式 轮 询 了 每 个 结 点 。 
从 询 协 议 消 除了 困扰 随机 接 入 协议 的 碰撞 和 空 时 际 ， 这 使 得 轮 询 取 得 高 得 多 的 效率 ， 


但 是 它 也 有 一 些 缺 点 。 第 一 个 缺点 是 该 协议 引信 了 轮 询 时 延 ， 即 通知 一 个 结 点 “ 它 可 以 传 
输 ” 所 需 的 时 间 。 例 如 ， 如 果 只 有 一 个 结 点 是 活跃 的 ， 那 么 这 个 结 点 将 以 小 于 尺 bps 的 速 
率 传 输 ， 因 为 每 次 活跃 结 点 发 送 了 它 最 多 数量 的 帧 时 ， 主 结 点 必须 依次 轮 询 每 一 个 非 活 路 





的 结 点 。 第 二 个 缺点 可 能 更 为 严重 ， 就 是 如 果 主 结 点 有 故障 、 整 个 信道 都 变 得 不 可 操作 ， 
第 二 种 轮流 协议 是 令 牌 传递 协议 (token- passing protocol). 在 这 种 协议 中 没有 主 结 点 ， 
一 个 称 为 令 牌 (token) 的 小 的 特殊 帧 在 结 点 之 间 以 某 种 国定 的 次 序 进行 交换 ， 例如 ， 结 
点 1 可 能 总 是 把 令 牌 发 送 给 结 点 2， 结 点 2 可 能 总 ,是 把 令 牌 发 送 给 结 点 3， 而 结 点 NA 可 能 
总 是 把 令 牌 发 送 给 结 点 1。 当 一 个 结 点 收 到 令 牌 时 ， 仅 当 它 有 一 些 帧 要 发 送 时 ， 它 才 持 有 
这 个 令 牌 ; 否则 ， 它 立即 向 下 一 个 结 点 转发 该 令 牌 。 当 一 个 结 点 收 到 令 牌 时 ， 如 果 它 确实 
有 帧 要 传输 ， 它 发 送 最 大 数目 的 帧 数 ， 然 后 把 令 牌 转发 给 下 一 个 结 点 。 令 牌 传递 是 分 散 


的 ， 并 有 很 蜗 的 效率 。 但 是 它 也 有 日 己 的 一 些 问题 。 例 如 ， 一 个 结 点 的 故障 可 能 会 使 整个 
信道 前 湿 。 或 者 如 果 一 个 结 点 偶然 忘记 了 释放 令 牌 ， 则 必须 调用 某 些 恢复 步骤 使 令 牌 返回 


到 循环 中 来 。 经 过 多 年 ， 人 们 已 经 开发 了 许多 令 牌 传递 协议 ， 包 括 光 纤 分 布 式 数 据 接 口 
(FDDI) 协 议 [Jain 1994] 和 IEEE 802.5 令 牌 环 协议 | IEEE 802.5 2012 |] ， 每 一 种 都 必须 解 
决 这 些 和 其 他 一 些 棘 手 的 问题 . 


5.3.4 DOCSIS: 用 于 电缆 因特网 接 入 的 链 路 层 协议 


在 前 面 3 小 市 中 ， 我 们 已 经 学 习 了 3 大 类 多 路 访问 协议 : 信道 划分 协议 、 随 机 接 入 协 
议和 轮流 协议 。 这 里 的 电 绕 接 入 网 将 作为 一 种 很 好 的 学 习 案 例 ， 因 为 在 电缆 接 入 网 中 我 们 
将 看 到 这 三 类 多 路 访问 协议 中 的 每 一 种 ! 

1.2. 1 节 讲 过 ， 一 个 电缆 接 人 网 通常 在 电缆 网 头 端 将 几 千 个 住宅 电缆 调制 解 调 器 与 一 
eh (Cable Modem Termination System, CMTS) 连接 。 数 据 经 电线 
服务 接口 ( Data- Over- Cable Service Interface, CMTS) 规范 (DOCSIS) | DOCSIS 2012] 定 
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X T HA RGE A FA Zi Re) A ESL, DOCSIS 使 用 FDM 将 下 行 (CMTS 到 调制 解 调 器 ) 
和 上 行 《 调制解调器 到 CMTS) 网 络 段 划分 为 多 个 频率 信道 。 每 个 下 行 信道 宽 6MHz， 每 
个 信道 具有 大 约 40Mbps 在 吐 量 (尽管 这 p hin R TE N Ek P ÍR > FE E Aa We tl AE Ye Ae L 
到 ) ; 每 个 上 行 信道 具有 6.4MHz ik KR fa i oe. HARKKI E ITA A 30Mbps 
每 个 上 行 和 下 行 信道 均 为 广播 信道 . CMTS a 下 行 信 道中 传输 的 帧 被 所 有 在 信道 上 做 接收 
的 电费 调制 解 调 瑚 接收 到 ; 然而 因为 仅 有 单一 的 CMTS 在 下 行 信道 上 传输 ， 不 存在 多 路 访 
问 问题 。 但 在 上 行 方 问 ， gri aee iin AA E A HEL A id dil fe Ve ar FE El 
CMTS 的 相同 上 行 信道 (频率 )， 因 此 能 够 潜在 地 出 现 碰撞 

e rg KWF TDM), BES ERY Ta] fa] bi EL E 
JEJTE, HEL At we) tl SPE A] AR OT HE TK IY BE [oy] CMTS 传输 。CMTS 显 式 地 准许 各 个 电 
AS Hed ill DAL AS TE PE OY) RE Bi PETE- CMTS 在 下 行 信道 上 通过 发 送 称 为 MAP 报 文 的 
控制 报 文 ， 指 定 哪 个 电缆 调制 解 调 带 (市 有 要 发 送 的 数据 ) 能 够 在 微 时 际 中 传输 由 控制 报 
文 指定 的 时 间 间 隅 。， 由 于 征 时 院 明 确 分 配给 电线 调制 解 调 需 ， 故 CMTS FEMS HR TE ED 
中 没有 碰撞 传输 o 








针对 时 间 间 隔 
(r,t. | IMAP hii 





”电缆 头 端 a a 
多 调 器 的 住 宝 





包含 微 时 阶 。 ”分配 的 包含 电缆 调制 
请 求 帧 的 解 调 器 上 行 
PINT BR retin. 


图 $-14 CMTS 和 电缆 调制 解 调 器 之 间 的 上 行 和 和 下行 信 道 


但 是 CMTS 一 开始 是 如 何 知 道 哪个 电费 调制 解 调 关 有 数据 要 发 送 呢 ? 通过 让 电缆 调制 
RPV ae Ee FAL A-SI BIERA P ig CMTS ea BTR Bar OR TAR E CIM IAAL 
务 ， 如 图 5-14 所 示 ， 这 些微 时 隙 请 求 帧 以 随机 接 入 方式 传输 ， 故 可 能 相互 碰撞 。 电 绕 调 
制 解 调 帝 既 不 能 侦 听 上 行 信 道 是 否 忙 ， 也 不 能 检测 碰撞 。 相反， 该 电费 调制 解 调 需 如 果 没 
有 在 下 一 个 下 行 控 制 报 文 中 收 到 对 请 求 分 配 的 响应 的 话 ， 就 推 新 出 它 的 微 时 辽 请 求 帧 经 历 
Pes aN Cee E Agi a il] Fa] aay E JH aE itd RG H Ge BE TAT OA tb 
延缓 到 以 后 的 时 隙 重新 发 送 。 当 在 上 行 信 道上 有 很 少 的 流量 ， 电 缆 调 制 解 调 右 可 能 在 名 
上 分 配给 微 时 际 请 求 帧 的 时 际 内 实际 传输 数据 帆 (因此 避免 不 得 不 等 待人 微 时 际 分 配 )。 

因此 ， 电 缆 接 入 网 可 作为 应 用 多 路 访问 协议 (EI FPM、TDM、 随 机 接 入 和 集中 分 配 
时 际 都 用 于 一 个 网 络 中 ) 的 一 个 极 好 例子 。 


5.4 交换 局 域 网 
前 面 一 节 涉 及 了 广播 网 络 和 多 路 访问 协议 ， 我 们 现在 将 注意 力 转 回 交 换 局 域 网 。 FE] S- 15 
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显示 了 一 个 交换 局 域 网 连接 了 3 个 部 门 ， 两 台 服 务 器 和 一 台 与 4 台 交换 机 连接 的 路 由 器 。 
央 为 这 些 区 换 机 运行 在 链 路 层 ， 所 以 它们 交换 链 路 层 帆 〈 而 不 是 网 络 层 数据 报 ) ， 不 识别 
网 络 层 地 址 ， 不 使 用 如 RIP 或 OSPF 这 样 的 路 由 选择 算法 来 确定 通过 第 2 层 交 换 机 网 络 的 
路 径 。 我 们 马上 就 会 看 到 ， 它 们 使 用 链 路 层 地 址 而 不 是 IP 地 址 来 转发 链 路 层 帧 通过 交换 
机 网 络 。 我 们 首先 以 讨论 链 路 层 寻 址 (5.4.1 节 ) 来 开始 对 交换 机 局 域 网 的 学 习 。 然 后 仔 
细 学 习 著 名 的 以 太 网 协议 (5.4.2 节 )。 在 仔细 学 习 链 路 层 寻 址 和 以 太 网 后 ， 我 们 将 考察 
链 路 层 交 换 机 的 工作 方式 (5.4.3 节 )， 并 随后 考察 通 当 是 如 何 用 这 些 交 换 机 构建 大 规模 
局 域 网 的 (5.4.4 节 ) 


Web 
Hit 3 ti 


到 外 部 
因特网 





100Mbps 100Mbps 100Mbps 
(光纤 ) (光纤 ) (光纤 ) 
10Mbps、100Mbps、 








1Gbps 的 5 类 线 
的 混合 = 





计算 机 科学 系 计算 机 工程 系 


图 5-15 由 4 台 交 换 机 连接 起 来 的 某 机 构 网 络 


5.4.1 链 路 层 寻 址 和 ARP 


主机 和 路 由 需 具 有 链 路 层 地 址 。 现 在 你 也 许 会 感到 惊讶 ， 第 4 草 中 不 是 讲 过 主机 和 路 
由 舌 也 具有 网 络 层 地 址 吗 ” 你 也 许 会 问 : 为 什么 我 们 在 网 络 层 和 链 路 层 者 震 要 地 址 呢 ? 除 
了 摘 述 链 路 层 地 址 的 域 法 和 功能 ， 在 本 忆 中 我 们 厦 望 明明 日 折 地 搞 清 楚 两 层 地 址 痢 有 用 的 
原因 ， 事 实 上 这 些 地 址 是 必 不 可 少 的 。 我 们 还 将 学 习 地 址 解析 协议 (ARP) ， 该 协 以 提供 
了 将 IP 地址 转换 为 链 路 层 地 址 的 机 制 ， 

1. MAC 地 址 

事实 上 ， 并 不 是 主机 或 路 由 带 具 有 链 路 层 地 址 ， 而 是 它们 的 适 配 硕 〈 即 网 络 接口 ) 具 
有 和 链 路 层 地 址 。， 因 此 ， 具 有 多 个 网 络 接口 的 主机 或 路 由 器 将 具有 与 之 相关 联 的 多 个 链 路 层 
地 址 ， 就 像 它 也 有 具有 与 之 相关 联 的 多 个 IP 地 址 一 样 。 然 而， 重要 的 是 注意 到 链 路 层 交 换 
机 并 不 具有 与 它们 的 接口 (这 些 接口 是 与 主机 和 路 由 需 相 连 的 ) 相关 联 的 链 路 层 地 址 。 这 
是 因为 链 路 层 交 换 机 的 任务 是 在 主机 与 路 由 器 之 间 承 载 数据 报 ; 交换 机 透明 地 执行 该 项 任 
务 ， 这 就 是 说 ， 主 机 或 路 由 需 不 必 明 确 地 将 帧 寻 址 到 其 间 的 交换 机 。 岁 S-16 中 说 明了 这 
种 情况 。 链 路 层 地 址 有 各 种 不 同 的 称呼 : LAN Hetk (LAN address) 、 物 理 地 址 (physical 
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address) 或 MAC 地址 (MAC address), 因为 MAC 地 址 似乎 是 最 为 流行 的 术语 ， 所 以 我 们 
此 后 束 将 链 路 层 地 址 称 为 MAC 地 址 。 对 于 大 多 数 局 域 网 (包括 以 太 网 和 802. 11 无 线 局 域 
网 ) 而 言 ，MAC 地 址 长 度 为 6 字 节 ， 共 有 2” 个 可 能 的 MAC 地址， 如 图 5-16 所 示 ， 这 些 6 
个 字 贡 地 址 通 负 用 十 六 进 制 表示 法 ， 地 址 的 每 个 字 节 被 表示 为 一 对 十 六 进 制 数 。 尽 管 
MAC 地 址 被 设计 为 永久 的 ， 但 用 软件 改变 一 块 适 配 检 的 MAC 地 址 现在 是 可 能 的 ， 然 而 ， 
对 于 本 市 的 后 面部 分 而 言 ， 我 们 将 假设 某 适 配 费 的 1A-23-F9-CD-06-9B 
MAC 地 址 是 固定 的 ， | 

MAC 地 址 的 一 个 有 趣 性 质 是 没有 两 块 适 配 需 
具有 相同 的 地 址 。 考 虑 到 适 配 带 是 由 许多 不 同 国家 
和 地 区 的 不 同 公司 生产 的 ， 这 看 起 来 似乎 是 件 神奇 “ae O 
之 事 。 中 国 台湾 生产 适配器 的 公司 如 何 能 够 保证 与 j> 2 IS 
比利时 生产 适 配 硕 的 公司 使 用 不 同 的 地 址 呢 ? 答案 eS 
是 IEEE 在 管理 看 该 MAC 地 址 空间 。 特 别 是 ， 当 一 49-BD-D2-C7-56-2A 
个 公司 要 生产 适配器 时 ， 它 支付 象征 性 的 费用 购买 。 畔 浊 
组 成 2* 个 地 址 的 一 块 地 址 空间 ，IEEE 分 配 这 块 a 
A TE a Rees a gai a 5-16 与 局 域 网 相连 的 每 个 接口 
特 ， 让 公司 上 自己 为 每 个 适 配 融 生成 后 24 比特 的 唯 都 有 一 个 唯一 的 MAC 地 址 
m 

ifea MAC 地 址 具有 局 平 结构 OASES), m HAANES egr EA E JHAR 
不 会 变化 .市 有 以 太 网 接口 的 便携 机 总 具有 同样 的 MAC 地 址 ， 无 论 该 计算 机 位 于 何方 。 
具有 802. 11 接口 的 一 台 智 能 手机 总 是 具有 相同 的 MAC 地 址 ， 无 论 该 智能 手机 到 哪里 。 与 
之 形成 对 照 的 是 ， 前 面 说 过 的 IP 地址 具有 层次 结构 ( 即 一 个 网 络 部 分 和 一 个 主机 部 分 )， 
而 且 当 主机 移动 时 ， 主 机 的 IP 地 址 需要 改变 ， 即 改变 它 所 连接 到 的 网 络 。 适 配 需 的 MAC 
地 址 与 人 的 社会 保险 号 相似 ,后 者 也 具有 扁平 寻 址 结构 ， 而 且 无 论 人 到 哪里 该 号 码 都 不 会 
变化 。IP 地 址 则 与 一 个 人 的 邮政 地 址 相似 ， 它 是 有 层次 的 ， 无 论 何 时 当 人 搬家 时 ， 该 地 址 
都 必须 改变 。 就 像 一 个 人 可 能 发 现 邮政 地 址 和 社会 保险 号 都 有 用 那样 ， 一 台 主 机 具有 一 个 
网 络 层 地 址 和 一 个 MAC 地 址 是 有 用 的 。 

当 茶 适 配 疮 要 问 某 些 目 的 适配器 发 送 一 个 帧 时 ， 发 送 适 配 句 将 目的 适 配 融 的 MAC 地 
址 插入 到 该 帧 中 ， 并 将 该 帧 发 送 到 局 域 网 上 。 如 我 们 马上 要 看 到 的 那样 ， 一 台 交 换 机 偶尔 
将 一 个 人 帧 广播 到 它 的 所 有 接口 。 我 们 将 在 第 6 章 中 看 到 802. 11 也 广播 帧 。 因 此 一 块 适 
配 雁 晤 以 接收 一 个 并 非 回 它 寻 址 的 帧 。 这样 ， 当 适 配 需 接 收 到 一 个 帧 时 ， 将 检查 该 帧 中 的 
目的 MAC 地 址 是 否 与 它 月 己 的 MAC 地 址 匹配 。 如 果 匹 配 ， 该 适配器 提取 出 封装 的 数据 
报 ， 并 将 该 数据 报 沿 协议 栈 向 上 传递 。 如 果 不 匹 配 ， 该 适配器 丢弃 该 帧 ， 而 不 会 向 上 传递 
该 网 络 层 数据 报 。 所 以 ， 仅 当 收 到 该 帧 时 ， 才 会 中 断 目的 地 。 

然而 ， 有 时 采 发 送 适 配 郑 的确 要 让 局 域 网 上 所 有 其 他 适 配 吕 来 接收 并 处 理 它 打算 发 
送 的 帧 。 在 这 种 情况 下 ， 发 送 适 配 顺 在 该 帧 的 目的 地 址 字段 中 搬入 一 个 特殊 的 MAC 广 
播 地 址 (broadcast address ) 。 对 于 使 用 6 字 节 地 址 的 局 域 网 (例如 以 太 网 和 802.11) 来 
说 ,广播 地 址 是 48 个 连续 的 工 组 成 的 字符 串 〈 即 以 十 六 进 制 表示 法 表示 的 FF-FF-FF-FF- 
FF-FF). 
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实践 原则 


保持 各 层 独 立 


主机 和 路 由 器 接口 除了 网 络 层 地 址 之 外 还 有 MAC 地 址 ， 这 有 如 下 几 个 原因 AA, 
局 域 网 是 为 任意 网 络 层 协议 而 设计 的 ， 而 不 只 是 用 于 IP 和 因特网 ， 如 果 适 配器 被 指派 
IP 地 址 而 不 是 “中 性 的 ”MAC 地 址 的 话 ， 则 适配器 将 不 能 够 方便 地 支持 其 他 网 络 层 协 
议 (例如 ，IPX 或 者 DECnet)， 其次， 如 果 适 配器 使 用 网 络 层 地 址 而 不 是 MAC 地 址 的 
话 ， 网 络 层 地 址 必须 存储 在 适配器 的 RAM 中， 并 且 在 每 次 适配器 移动 (或 加 电 ) 时 要 
重新 配置 ， 另 一 种 选择 是 在 适配器 中 不 使 用 任何 地 址 ， 让 每 个 适配器 将 它 收 到 的 每 帧 数 
据 (通常 是 JP 数据 报 ) 沿 协议 栈 向 上 传递 。 然后 网 络 层 则 能 够 核对 网 络 地 址 层 是 否 匹 
配 ， 这 种 选择 带 来 的 一 个 问题 是 ， 主 机 将 被 局 域 网 上 发 送 的 每 个 帧 中 断 ， 包 括 被 目的 地 
是 在 相同 广播 局 域 网 上 的 其 他 结 点 的 帧 中 断 .。 总 之 ,为 了 使 网 络 体 系 结构 中 各 层次 成 为 
极为 独立 的 构建 模块 ， 不 同 的 层次 需要 有 它们 自己 的 寻 址 方案 . 我 们 现在 已 经 看 到 3 种 
类 型 的 地 址 : 应 用 层 的 主机 名 、 网 络 层 的 IP 地 址 以 及 链 路 层 的 MAC 地 址 


2. 地 址 解析 协议 

因为 存在 网 络 层 地 址 (例如 ， 因 特 网 的 IP 地址 ) 和 链 路 层 地 址 〈《 即 MAC 地 址 ) ， 所 
以 寄 要 在 它们 之 间 进 行 转换 。 对 于 因特网 而 言 ， 这 是 地 址 解析 协议 (Address Resolution 
Protocol, ARP)[ RFC 826] 的 任务 。， 

为 了 理解 对 于 诸如 ARP 这 样 协 议 的 需求 ， 考 虑 如 图 5-17 所 示 的 网 络 ， 在 这 个 简单 的 
例子 中 ， 每 台 主 机 和 路 由 器 有 一 个 单一 的 IP 地 址 和 单一 的 MAC 地 址 ， 与 以 入 一 样 ，IP 地 
址 以 点 分 十 进 制 表示 法 表示 ，MAC 地 址 以 十 六 进 制 表 示 法 表示 ， 为 了 便于 讨论 ， 我 们 在 
本 节 中 将 假设 交换 机 广播 所 有 帧 ;这 就 是 说 ， 无 论 何 时 交换 机 在 一 个 接口 接收 一 个 帧 ， 它 将 
在 其 所 有 其 他 接口 上 转发 该 帧 。 在 下 一 节 中 ， 我 们 将 更 为 准确 地 解释 交换 机 操作 的 过 程 。 


1A-23-F9-CD-06-9B 





图 5-17 局域网 上 的 每 个 接口 都 有 一 个 IP 地 址 和 一 个 MAC. 地 址 


现在 假设 IP 地 址 为 222. 222. 222. 220 的 主机 要 向 主机 222. 222. 222. 222 发 送 IP 数据 
报 。 在 本 例 中 ， 源 和 目的 均 位 于 相同 的 子 网 中 (在 4.4.2 节 中 的 寻 址 意义 下 )。 为 了 发 送 效 
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据 报 ， 该 源 必须 要 问 它 的 适 配 融 不 仅 提 供 JP 数据 报 ， 而 且 要 提供 目的 主机 222. 222. 222. 222 
的 MAC 地 址 ， 然 后 发 送 适 配 硕 将 构造 一 个 包含 目的 地 的 MAC 地 址 的 链 路 层 帧 ， 并 把 该 帧 

在 本 节 中 要 处 理 的 重要 问题 是 ， 发 送 主机 如 何 确 定 IP 地 址 为 222. 222. 222. 222 的 目的 
主机 的 MAC 地 址 呢 ? 正如 你 也 许 已 经 猜想 的 那样 ， 它 使 用 ARP. 在 发 送 主机 中 的 ARP 模 
块 将 取 在 相同 局 域 网 上 的 任何 IP 地 址 作为 输入 ， 然 后 返回 相应 的 MAC 地 址 。 在 眼下 的 这 
个 例子 中 ， 发 送 主机 222. 222. 222. 220 向 它 的 ARP 模块 提供 了 IP 地 址 222. 222. 222. 222, 
并 且 其 ARP 模块 返回 了 相应 的 MAC 地 址 49-BD-D2-C7-56-2A. 

因此 我 们 看 到 了 ARP 将 一 个 IP 地 址 解析 为 一 个 MAC 地 址 。 在 很 多 方面 它 和 DNS 
(在 2.5 市 中 人 研究 过 ) 类 似 ，DNS 将 主机 名 解析 为 IP 地 址 。 然 而 ， 这 两 种 解析 副 之 间 的 一 
个 重要 区 别 是 ，DNS 为 在 因特网 中 任何 地 方 的 主机 解析 主机 名 ， 而 ARP 只 为 在 同一 个 子 
网 上 的 主机 和 路 由 融 接 口 解析 IP 地址。 如果 美国 加 利 福 尼 亚 州 的 一 个 结 点 试图 用 ARP 为 
美国 密西西比 州 的 一 个 结 点 解析 IP 地 址 ，ARP 将 返回 一 个 错误 。 

既然 已 经 解释 了 ARP 的 用 途 ， 我 们 再 来 看 看 它 是 如 何 工作 的 。 每 吾 主 机 或 路 由 正在 
其 内 存 中 具有 一 个 ARP 表 (ARP table)， 这 张 表 包含 IP 地 址 到 MAC 地 址 的 映射 关系 . 
图 5-18 显示 了 在 主机 222. 222. 222. 220 中 可 能 看 到 的 ARP 表 中 的 内 容 。 该 ARP 表 也 包含 
一 个 寿命 (TTL) 值 ， 它 指示 了 从 表 中 删除 每 个 映射 的 时 间 。 注意 到 这 张 表 不 必 为 该 子 网 
上 的 每 台 主 机 和 路 由 融 都 包含 一 个 表 项 ; 某 些 可 能 从 来 没有 进入 到 该 表 中 ， 某 些 可 能 已 经 
过 期 。 从 一 个 表 项 放置 到 某 ARP 表 中 开始 ， 一 个 表 项 通常 的 过 期 时 间 是 20 分 钟 。 

Pek MAc 地 址 TL | 
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图 5-18 在 主机 222. 222. 222. 220 中 的 一 个 可 能 的 ARP # 


现在 假设 主机 222. 222. 222. 220 要 发 送 一 个 数据 报 ， 该 数据 报 要 IP 寻 址 到 本 子 网 上 为 
一 台 主 机 或 路 由 需 。 发 送 主机 需要 获得 给 定 IP 地 址 的 目的 主机 的 MAC 地 址 。 如 果 发 送 方 
的 ARP 表 具 有 该 目的 结 点 的 表 项 ， 这 个 任务 是 很 容易 完成 的 。 但 如 果 ARP 表 中 当前 没有 
该 目的 主机 的 表 项 ， 又 该 怎么 办 呢 ? 特别 是 假设 222. 222. 222. 220 要 向 222. 222. 222. 222 
发 送 数 据 报 。 在 这 种 情况 下 ， 发 送 方 用 ARP 协议 来 解析 这 个 地 址 。 首先， 发 送 方 构造 一 
个 称 为 ARP 分 组 (ARP packet) 的 特殊 分 组 ,一 个 ARP 分 组 有 几 个 字段 ， 包括 发 送 和 接 
收 IP 地 址 及 MAC 地址 。ARP 查询 分 组 和 响应 分 组 部 具有 相同 的 格式 。ARP 查询 分 组 的 目的 
是 询问 子 网 上 所 有 其 他 主机 和 路 由 需 ， 以 确定 对 应 于 要 解析 的 IP 地 址 的 那个 MAC 地 址 。 

回 到 我 们 的 例子 上 来 ，222. 222. 222. 220 回 它 的 适 配 需 传递 一 个 ARP 查询 分 组 ， 并 且 
指示 适 配 需 应 该 用 MAC 广播 地 址 CB FF-FF-FF-FF-FF-FF) KEXA. ii MANTE 
链 路 层 帧 中 封装 这 个 ARP 分 组 ， 用 广播 地 址 作为 帧 的 目的 地 址 ， 并 将 该 帧 传输 进 子 网 中 。 
回想 我 们 的 社会 保险 号 /邮政 地 址 的 类 比 ， 一 次 ARP 查询 等 价 于 一 个 人 在 某 公司 (比方 说 
AnyCorp) 一 个 拥挤 的 房间 大 喊 :“ 邮 政 地 址 是 加 利 福 尼 亚 州 帕 罗 奥 图 市 AnyCorp 公司 112 
房间 13 室 的 那个 人 的 社会 保险 号 是 什么 ?” 包 含 该 ARP 查询 的 帧 能 被 子 网 上 的 所 有 其 他 
适配器 接收 到 ， 并 且 (由 于 广播 地 址 ) 每 个 适 配 融 都 把 在 该 帧 中 的 ARP 分 组 回 上 传递 给 
ARP 模块 。 这 些 ARP 模块 中 的 每 个 都 检查 它 的 IP 地 址 是 否 与 ARP 分 组 中 的 目的 IP 地址 
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相 匹 配 。 与 之 匹配 的 一 个 给 查询 主机 发 送 回 一 个 币 有 所 希望 映射 的 啊 应 ARP 分 组 。 然 后 
查询 主机 222. 222. 222. 220 能 够 更 新 它 的 ARP 表 ， 并 发 送 它 的 下 数据 报 ， 该 数据 报 封 家 
在 一 个 链 路 层 帧 中 ， 并 且 该 帧 的 目的 MAC 就 是 对 先前 ARP 请 求 进 行 啊 应 的 主机 或 路 由 器 
的 MAC 地 址 . 

关于 ARP 协议 有 两 件 有 趣 的 事情 需要 注意 。 首先 ， 查 询 ARP 报 文 是 在 广播 帧 中 发 送 
的 ， 而 响应 ARP 报 文 在 一 个 标准 帧 中 发 送 。 在 继续 阅读 之 前 ， 你 应 该 思考 一 下 为 什么 这 
样 。 其 次 ，ARP 是 即 搬 即 用 的 ， 这 就 是 说 ， 一 个 ARP 表 是 自动 建立 的 ， 即 它 不 需要 系统 
管理 员 来 配置 。 并 且 如 果 某 主机 与 子 网 断 开 连接 ， 它 的 表 项 最 终 会 从 留 在 子 网 中 的 结 点 的 
表 中 删除 挥 。 

学 生 们 常常 想 知道 ARP 是 一 个 链 路 层 协议 还 是 一 个 网 络 层 协议 。 如 我 们 所 见 ， 一 个 
ARP 分 组 封装 在 链 路 层 帆 中 ， 因 而 在 体系 结构 上 位 于 链 路 层 之 上 。 然而， 一 个 ARP 分 组 
具有 包含 链 路 层 地 址 的 字段 ， 因 而 可 认为 是 链 路 层 协 议 ,但 它 也 包含 网 络 层 地 址 ， 因 而 也 可 
认为 是 为 网 络 层 协议 。 所 以 ， 可 能 最 好 把 ARP 看 成 是 跨越 链 路 层 和 网 络 层 边界 两 边 的 协议 ， 
即 不 完全 符合 我 们 在 第 1 章 中 学 习 的 简单 的 分 层 协 议 栈 。 现 实 世 界 协议 就 是 这 样 复杂 |! 

3. 发 送 数据 报到 子 网 以 外 

现在 应 该 摘 清 楚 当 一 台 主 机 要 向 相同 子 网 上 的 另 一 台 主 机 发 送 一 个 数据 报时 ARP 的 
操作 过 程 。 但 是 现在 我 们 来 看 更 复杂 的 情况 ， 即 当 子 网 中 的 某 主 机 要 问 子 网 之 外 (也 就 是 
跨越 路 由 颖 的 另 一 个 子 网 ) 的 主机 发 送 网 络 层 数据 报 的 情况 。 我 们 在 图 5-19 的 环境 中 来 
讨论 这 个 问题 ， 该 图 显示 了 一 个 由 一 台 路 由 器 互联 两 个 子 网 所 组 成 的 简单 网 络 。 
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图 5$-19 ”由 一 人 台 路 由 融和 互联 的 两 个 子 网 


有 关 图 5-19 需要 注意 几 件 有 趣 的 事情 。 每 台 主 机 仅 有 一 个 IP 地 址 和 一 个 适 配 右 。 但 
是 ， 如 第 4 章 所 讨论 ， 一 台 路 由 需 对 它 的 每 个 接口 都 有 一 个 IP 地 址 。 对 路 由 大 的 每 个 接 
口 ，( 在 路 由 咒 中 ) 也 有 一 个 ARP 模块 和 一 个 适 配 副 。 在 图 5-19 中 的 路 由 硕 有 两 个 接口 ， 
所 以 它 有 两 个 IP 地 址 、 两 个 ARP 模块 和 两 个 适 配 需 。 当 然 ， 网 络 中 的 每 个 适 配 规 都 有 上 自 
己 的 MAC 地 址 。 

还 要 注意 到 子 网 1 的 网 络 地 址 为 111. 111. 111/24、 子 网 2 的 网 络 地 址 为 222. 222. 222/24, 
因此 ， 与 子 网 1 相连 的 所 有 接口 都 有 格式 为 111.111. 111. xxx 的 地 址 ， 与 子 网 2 相连 的 所 
有 接口 都 有 格式 为 222. 222. 222. xxx 的 地 址 。 

现在 我 们 考察 子 网 1 上 的 一 台 主 机 将 同和 子 网 2 上 的 一 台 主 机 发 送 数据 报 。 特 别 是 ， 假 
设 主 机 111.111.111.111 要 向 主机 222. 222. 222. 222 发 送 一 个 IP 数据 报 。 和 往常 一 样 ， 发 
送 主机 向 它 的 适 配 需 传递 数据 报 。 但 是 ， 发 送 主机 还 必须 问 它 的 适 配 硕 指示 一 个 适当 的 目 
的 MAC 地 址 。 该 适 配 需 应 该 使 用 什么 MAC 地 址 呢 ? 有 人 也 许 大 胆 猜 测 ， 这 个 适当 的 MAC 
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地 址 就 是 主机 222. 222. 222.222 的 适 配 化 地 址 ， 即 49-BD-D2-C7-56-2A. 然而 ， 这 个 猜测 
是 错误 的 ! 如 果 发 送 适 配 需要 用 那个 MAC 地 址 ， 那 么 子 网 1 上 所 有 的 适 配 壳 都 不 会 费心 
将 该 耳 数 据 报 传递 到 它 的 网 络 层 ， 因 为 该 帆 的 目的 地 址 与 子 网 1 上 所 有 适 配 融 的 MAC 地 
址 部 将 不 匹配 。 这 个 数据 报 将 只 有 死亡， 到 达 数 据 报 天 国 

如 果 我 们 仔细 地 观察 图 5-19， 我 们 发 现 为 了 使 一 个 数据 报 从 111.111.111.111 到 子 网 
2 上 的 主机 ， 该 数据 报 必 须 首先 发 送 给 路 由 天 接 口 111.111.111.110， 它 是 通 往 最 终日 的 
地 路 径 上 上 的 第 一 跳 路 由 融 的 下 地 址 . 因此， 对 于 该 帧 来 说 ， 迁 当 的 MAC Hahk iek H Arik 
口 111.111.111.110 的 适配器 地 址 ， 即 E6- E9- 00- 17- BB-4B. 但 发 送 主 机 怎样 获得 
111.111.111.110 的 MAC 地址 呢 7 当然 是 通过 使 用 ARP! 一 旦 发 送 适 配 右 有 了 这 个 MAC 
地 址 ， 它 创建 一 个 帧 (包含 了 寻 址 到 222. 222. 222. 222 的 数据 报 ) ， 并 把 该 帧 发 送 到 子 网 1 
中 。 在 子 网 1 上 的 路 由 需 适 配 融 看 到 该 链 路 层 帧 是 回 它 寻 址 的 ， 因 此 把 这 个 帧 传递 给 路 由 
A ZR Jo, J2! 该 下 数据 报 终于 被 成 功 地 从 源 主机 移动 到 这 台 路 由 带 卫 ! 但 是 我 们 
的 任务 还 没有 结束 。 我 们 仍然 要 将 该 数据 报 从 路 由 大 移动 到 目的 地 路 由 带 现 在 必须 决定 
该 数据 报 要 被 转发 的 正确 接口 。 如 在 第 4 章 中 所 讨论 的 ， 这 是 通过 得 询 路 由 关中 的 转发 表 
来 完成 的 。 转 发 表 告 诉 这 人 台 路 由 需 该 数据 报 要 通过 路 由 需 接 口 222. 222. 222. 220 转发 ， 然 
后 该 接口 把 这 个 数据 报 传递 给 它 的 适 配 带 ， 适 配 带 把 该 数据 报 封 覆 到 一 个 新 的 帧 中 ， 并 且 
将 帧 发 送 进 子 网 2 中 。 这 时 ， 该 帧 的 目的 MAC 地 址 确实 是 最 终日 的 地 MAC 地 址 。 路 由 器 
义 是 怎样 获得 这 个 日 的 地 MAC 地 址 的 呢 ? 当然 是 用 ARP 获得 的 ! 

用 于 以 太 网 的 ARP 定义 在 RFC 826 P, E TCP/IP 指南 RFC 1180 中 对 ARP 进行 了 很 
好 的 介绍 .我 们 将 在 读 后 习题 中 更 为 详细 地 人 赋 究 ARP., 


5.4.2 以 太 网 


以 太 网 几乎 占领 着 现 有 的 有 线 局 域 网 市 场 . 在 20 世纪 80 年 代 和 90 年 代 早 期 ， 以 大 
网 面临 着 来 自 其 他 局 域 网 技术 包括 令 牌 环 、FDDI 和 ATM 的 挑战 。 多 年 来 ， 这些 其 他 技术 
中 的 一 些 成 功 地 抓 住 了 部 分 局 域 网 市 场 份额 ,但 是 目 从 20 世纪 70 年 代 中 期 发 明 以 太 网 以 
来 ， 它 就 不 断 演化 和 发 展 ， 并 保持 了 它 的 支配 地 位 : 今天 ， 以 太 网 是 到 目前 为 止 最 流行 的 
有 线 局 域 网 技术 ， 而 且 到 可 能 预见 的 将 来 它 可 能 仍 保 持 这 一 位 置 。 可 以 这 么 说 ， 以 太 网 对 
本 地 区 域 联网 的 重要 性 就 像 因 特 网 对 全 球 联网 所 具有 的 地 位 那样 - 

以 太 网 的 成 功 有 很 多 原因 ， 首 先 ， 以 太 网 是 第 一 个 广泛 部 署 的 高 速 局 域 网 。 因 为 它 部 
园 得 早 ， 网 络 管理 员 非 常熟 悉 以 太 网 〈 它 的 奇迹 和 它 的 奇 思 妙 想 ) ， 并 当 其 他 局 域 网 技术 
问世 时 ， 他 们 不 愿意 转 而 用 之 。 其 次 ， 令 牌 环 、FDDI Al ATM 比 以 太 网 更 加 复杂 、 更 加 昂 
贵 ， 这 就 进一步 阻碍 了 网 络 管理 员 改 用 其 他 技术 - 第 三 ， 改 用 其 他 局 域 网 技术 〈 例 如 
FDDI 和 ATM) 的 最 引 人 注 目的 原因 通常 是 这 些 新 技术 具有 更 高 数据 速率 ; 然而 以 太 了 网 总 
是 奋起 抗争 ， 产 生 了 运行 在 相同 或 更 高 数据 速率 下 的 版 本 。20 世纪 90 年 代 初 期 还 引入 本 
交换 以 太 网 ， 这 就 进一步 增加 了 它 的 有 效 数据 速率 。 最 后 ， 由 于 以 太 网 已 经 很 流行 ， 所 
以 以 太 网 硬件 (OD A a Bi a CPHL) 成 为 了 一 个 普通 商品 ， 而 且 极 为 便宜 . 

Bob Metcalfe 和 David Boggs 在 20 世纪 70 年 代 中 期 发 明 初 始 的 以 太 局 域 网 . 初始 的 以 
太 局 域 网 使 用 同 轴 电 缆 总 线 来 互联 结 点 。 以 太 网 的 总 线 拓扑 实际 上 从 20 世纪 80 年 代 到 90 
年 代 中 期 一 直 保 持 不 变 。 使 用 总 线 拓扑 的 以 太 网 是 一 种 广播 局 域 网 ， 即 所 有 传输 的 帆 传 送 
到 与 该 总 线 连 接 的 所 有 适配器 并 被 其 处 理 。 回忆 一 下 ， 我 们 在 3.3.2 节 中 讨论 了 以 太 网 的 
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具有 二 进 制 指 数 回 退 的 CSMA/CD 多 路 访问 协议 。 

到 了 20 世纪 90 年 代 后 期 ， 大 多 数 公司 和 大 学 使 用 一 种 基于 集 线 带 的 星 形 拓扑 以 太 网 
安装 替代 了 它们 的 局 域 网 。 在 这 种 安装 中 ， 主 机 CARR a) 下 接 用 双 纹 对 铜 线 与 一 从 集 
线 器 相连 。 集 线 器 (hub) 是 一 种 物理 层 设 备 ， 它 作用 于 各 个 比特 而 不 是 作用 于 帧 ， 当 表 
示 一 个 0 或 一 个 1 的 比特 到 达 一 个 接口 时 ， 集 线 需 只 是 重新 生成 这 个 比特 ， 将 其 能 量 强 度 
放大 ， fence cgi E. Pit. ORS SEF RZ at AY A Ph Fb ay LO A 
也 是 一 个 广播 局 域 网 ， 即 无 论 何 时 集 线 硕 从 它 的 一 个 接口 接收 到 一 个 比特 ， 它 四 其 所 有 其 
es 如 果 某 集 线 融 同时 从 两 个 不 同 的 接 日 接收 到 幅 ， 将 出 
现 一 次 健 撞 ， 生 成 该 帧 的 结 点 必须 重新 传输 该 帧 

在 21 世纪 早期 ， 以 太 网 又 经 历 了 一 次 重要 的 革命 性 变化 。 以 太 网 安 交 继续 使 用 星 
拓扑 ， 但 是 位 于 中 心 的 集 线 带 被 交换 机 (switch) WME EAT me 
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换 以 太 网 。 眼 下 我 们 仅 知道 交换 机 不 仅 是 “无 碰撞 的 "， 而 且 也 是 名 副 其 实 的 存储 转发 分 
组 交换 机 就 可 以 了 ; 但 是 与 运行 在 局 至 第 3 Jz 的 路 由 器 不 同 ， 交换 机 仪 运行 在 第 2 JE. 

1. 以 太 网 帧 结构 

以 太 网 帧 如 图 5-20 Ara. ANSE A, FRAT 到 许多 有 关 以 太 网 
的 知识 。 








类 型 
图 5-20 ”以 太 网 帆 结 构 


为 了 将 对 以 太 网 帧 的 讨论 放 到 团 实 的 环境 中 ， 考 虑 从 一 台 主 机 向 男 一 台 主 机 发 送 一 个 
IP 数据 报 ， 且 这 两 台 主 机 在 相同 的 以 太 局 域 网 上 (例如 ， 如 图 5-17 所 示 的 以 太 局 域 网 )， 
(尽管 以 太 网 帧 的 负载 是 一 个 IP 数据 报 ， 但 我 们 注意 到 以 太 网 帧 也 人 能够 承载 其 他 网 络 层 分 
4H.) 设 发 送 适 配器 ( 即 适 配 A) 的 MAC 地 址 是 AA-AA- AA-AA-AA-AA， 接 收 适 配 带 
( 即 适 配器 B) 的 MAC 地 址 是 BB-BB-BB-BB-BB-BB。 发 送 适 配 融 在 一 个 以 太 网 帆 中 封 痛 
了 一 个 卫 数 据 报 ， 并 把 该 帧 传递 到 物理 层 。 接 收 适 配 贺 从 物理 层 收 到 这 个 帧 ， 提 取出 IP 
数据 报 ， 并 将 该 IP 数据 报 传递 给 网 络 屋 。 我 们 现在 在 这 种 情况 下 考察 如 图 5-20 所 示 的 以 
太 网 帆 的 6 个 字段 : 
e 数据 字段 (46 ~ 1500 字 节 )。 这 个 字段 承载 7 有 P 数据 报 , 以 太 网 的 最 大 传输 单元 
(MTU) 是 1500 字 节 。 这 意味 着 如 果 IP 数据 报 超 过 了 1500 字 市 ， 则 主机 必须 将 
该 数据 报 分 片 ， 如 4. 4. 1 节 所 讨论 。 数据 字 段 的 最 小 长 度 是 46 FH, AERA N 
R IP 数据 报 小 于 46 字 节 ， 数 据 报 必须 被 填充 到 46 字 节 ,， 当 采用 填充 时 ， ean 
网 络 层 的 数据 包括 IP 数据 报 和 填充 部 分 。 网 络 层 使 用 IP 数据 报 首 部 中 的 长 度 字 段 
来 去 除 填充 部 分 。 
e 目的 地 址 (6 字 节 )。 这 个 字段 包含 目的 适 配 关 的 MAC 地址， 即 BB- BB- BB- BB- 
BB- BB。， 当 适 配 帮 B 收 到 一 个 以 太 网 帧 ， 帆 的 目的 地 址 无 论 是 BB- BB- BB- BB- BB- 
BB, WE MAC 广播 地 址 ， 它 都 将 该 帧 的 数据 字段 的 内 容 传递 给 网 络 层 ; 如 果 它 收 
到 了 上 有 具有 任何 其 他 MAC 地 址 的 帧 ， 则 丢弃 之 。 
e 源 地 址 (6 字 节 )。 这 个 字段 包含 了 传输 该 帧 到 局 域 网 上 的 适 配 天 的 MAC 地 址 ， 
在 本 例 中 为 AA-AA-AA-AA-AA-AA, 
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e 类 型 字段 (2 字 节 )。 类 型 字段 允许 以 太 网 复 用 多 种 网 络 层 协议 。 为 了 理解 这 点 ， 
我 们 需要 记 住 主机 能 够 使 用 除了 IP 以 外 的 其 他 网 络 层 协议 。 事 实 上， 一 人 台 给 定 的 
主机 可 以 支持 多 种 网 络 层 协议 ， 以 对 不 同 的 应 用 采用 不 同 的 协议 。 因 此 ， 当 以 太 
网 帧 到 达 适 配器 B， 适 配 需 B 需要 知道 它 应 该 将 数据 字段 的 内 容 传 递 给 哪个 网 络 
层 协议 (BIE). IP 和 其 他 链 路 层 协议 (fila, Novell IPX 或 AppleTalk) 都 有 
它们 各 自 的 、 标 准 化 的 类 型 编号 。 此 外 ，ARP 协议 (在 上 一 节 讨 论 过 ) 有 自己 的 
类 型 编号 ， 并 且 如 果 到 达 的 帧 包含 ARP 分 组 ( 即 类 型 字段 的 值 为 十 六 进 制 的 
0806), MJZ ARP 分 组 将 被 多 路 分 解 给 ARP 协议 。 注意 到 该 类 型 字段 和 网 络 层 数 
据 报 中 的 协议 字段 、 运 输 层 报 文 段 的 端口 号 字段 相 类 似 ; 所 有 这 些 字 段 孝 是 为 了 
把 一 层 中 的 某 协议 与 上 一 层 的 某 协 议 结合 起 来 。 

e CRC (4 字 节 )。 如 5.2.3 节 中 讨论 的 那样 ，CRC (循环 元 余 检测 ) 字段 的 目的 是 
使 得 接收 适 配 需 (适配器 B) 检测 帧 中 是 否 引 人 了 了 差 销 。 

e 前 同步 码 (8 字 节 )。 以 太 网 帧 以 一 个 8 字 节 的 前 同步 码 (Preamble) 字段 开始 。 
该 前 同步 码 的 前 7 字 节 的 值 都 是 10101010; 最 后 一 个 字 节 是 10101011。 前 同步 但 
字段 的 前 7 字 节 用 于 “唤醒 ”接收 适配器 ， 并 且 将 它们 的 时 钟 和 发 送 方 的 时 钟 同 
步 。 为 什么 这 些 时 钟 会 不 同步 呢 ? 记 住 适 配 需 A 的 目的 是 根据 以 太 局 域 网 类 型 的 
不 同 ， 分 别 以 10Mbps 、100Mbps 或 者 1Cbps 的 速率 传输 帧 。 然 而 ， 没 有 什么 是 完 
FAJ, PAE AC AE A 不 会 以 精确 的 额定 速率 传输 帧 ;相对 于 额定 速率 总 有 一 
些 漂移 ， 局 域 网 上 的 其 他 适 配 需 不 会 预先 知道 这 种 漂移 的 。 接 收 适 配 疮 只 需 通 过 
锁定 前 同步 码 的 前 7 字 节 的 比特 ， 就 能 够 锁定 适 配 需 A 的 时 钟 。 前 同步 码 的 第 8 
个 字 节 的 最 后 两 个 比特 (第 一 个 出 现 的 两 个 连续 的 1) AC a B, “重要 的 内 
容 ” 就 要 到 来 了 。 

所 有 的 以 太 网 技术 都 向 网 络 层 提 供 无 连接 服务 。 这 就 是 说 ， 当 适 配 需 A Be (nj id fic ae B 
发 送 一 个 数据 报时 ， 适 配器 A 在 一 个 以 太 网 帧 中 封装 该 数据 报 ， 并 且 把 该 帧 发 送 到 局 域 网 
上 ， 没 有 先 与 适配器 B 握手 。 这 种 第 二 层 的 无 连接 服务 类 似 于 IP 的 第 三 层 数 据 报 服务 和 
UDP 的 第 4 层 无 连接 服务 。 

以 太 网 技术 都 向 网 络 层 提供 不 可 靠 服务 (unreliable service), FRR AE, “Eftr BX 
到 一 个 来 自 适 配器 A 的 帧 ， 它 对 该 帧 执行 CRC 校 验 ， 但 是 当 该 帧 通过 CRC 校 验 时 它 既 不 
发 送 确认 帧 ， 而 当 该 帧 没有 通过 CRC 校 验 时 它 也 不 发 送 和 否定 确认 帧 。 当 某 帧 没有 通过 
CRC 校 验 ， 适 配器 B 只 是 丢弃 该 帧 。 因 此 ， 适 配器 A 根本 不 知道 它 传 输 的 帧 是 否 到 达 了 B 
并 通过 了 CRC 校 验 。( 在 链 路 层 ) 缺乏 可 靠 的 传输 有 助 于 使 得 以 太 网 简单 和 便宜 。 但 是 它 

1 意味 着 传递 到 网 络 层 的 数据 报 流 能 够 有 间 际 。 

如 果 由 于 丢弃 了 以 太 网 帧 而 存在 间 险 ， 主 机 了 B 上 的 应 用 也 会 看 见 这 个 间 际 吗 ? 如 我 们 
在 第 3 章 中 学 习 的 那样 ， 这 只 取决 于 该 应 用 是 使 用 UDP 还 是 使 用 TCP。 如 果 应 用 使 用 的 是 
UDP， 则 主机 B 中 的 应 用 的 确 会 看 到 数据 中 的 间 陀 。 另 一 方面 ， 如 果 应 用 使 用 的 是 TCP, 
则 主机 B 中 的 TCP 将 不 会 确认 包含 在 丢弃 帧 中 的 数据 ， 从 而 引起 主机 A 的 TCP 重 传 。 注 
意 到 当 TCP 重 传 数 据 时 ， 数 据 最 终 将 回 到 曾经 丢弃 它 的 以 太 网 适 配 带 。 因 此 ， 从 这 种 意义 
上 来 说 ， 以 太 网 的 确 重 传 了 数据 ， 尽 管 以 太 网 并 不 知道 它 是 正在 传输 一 个 具有 全 新 数据 的 
全 新 数据 报 ， 还 是 一 个 包含 已 经 被 传输 过 至 少 一 次 的 数据 的 数据 报 。 
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Bob Metcalfe 和 以 太 网 


作为 20 世纪 70 年 代 早 期 哈佛 大 学 的 一 名 博士 生 ，Bob Metcalfe 在 MIT 从 事 ARPA- 
net 的 研究 ”在 他 学 习 期 间 ， 他 还 受到 了 Abramson 有 关 ALOHA 和 随机 接 入 协议 工作 的 
影响 在 完成 了 他 的 博士 学 位 ， 并 在 开始 Xerox Palo Alto 研究 中 心 (Xerox PARC) 的 工 
作 之 前 ， 他 用 3 个 月 访问 了 Abramson 和 他 在 夏威夷 大 学 的 同事 ， 获 得 了 ALOHAnet 的 第 
一 手 资料 .在 Xerox PARC, Metcalfe 受到 了 Alto 计算 机 的 影响 ， 这 种 计算 机 在 很 多 方面 
是 20 世纪 80 年 代 个 人 计算 机 的 先驱 ， Metcalfe 看 到 了 对 这 些 计 算 机 以 一 种 不 昂贵 的 方 
式 组 网 的 需求 、 因 此 ， 基 于 他 在 APRAnet、ALOHAnet 和 随机 接 入 协议 方面 的 知识 ， 
Metcalfe 和 他 的 同事 David Boggs 一 起 发 明了 以 太 网 

Metcalfe 和 Boggs 的 初始 以 太 网 运行 速度 为 2.94Mbps， 连 接 长 达 一 英里 范围 的 多 达 
256 台 主 机 。Metcalfe 和 Boggs 成 功 地 使 得 Xerox PARC 的 大 多 数 研 究 人 员 通 过 他 们 的 
Alto 计算 机 互相 通信 。 然后 Metcalfe 推进 了 Xerox, Digital 和 Intel 联盟 ， 创 建 了 以 太 网 
作为 一 种 10Mbps 的 以 太 网 标准 ， 该 标准 后 被 IEEE T., Xerox 对 以 太 网 商业 化 没有 表 
现 出 太 多 的 兴趣 ，1979 年 ，Metcalfe 建立 了 自己 的 公司 3Com， 它 发 展 和 商业 化 包括 以 
太 网 技术 在 内 的 联网 技术 ， 特别 是 ，3Com Æ 20 世纪 80 年 代 早 期 为 非常 流行 的 IBM PC 
开发 了 以 太 网 网 卡 并 使 之 市 场 化 ，1990 $, Metcalfe 离开 了 3Com， 当 时 3Com Æ 2000 
名 员工 和 4 亿美 元 的 年 收入 ， 


2. 以 太 网 技术 

在 以 上 的 讨论 中 我 们 已 经 提 到 以 太 网 ， 仿 佛 它 有 单一 的 协议 标准 似 的 。 但 事实 上 ， 以 
太 网 具有 许多 不 同 的 特色 ， 上 有 具有 革 种 令 人 眼花 红 乱 的 首 字母 缩写 词 ， 如 10BASE-T、 
10BASE-2、100BASE-T、1000BASE-LX 和 10GBASE-T。 这 些 以 及 许多 其 他 的 以 太 网 技术 
在 多 年 中 已 经 被 IEEE 802.3 CSMA/CD( Ethernet) 工作 组 标准 化 了 [IEEE 802. 3 2012], 
尽管 这 些 首 字母 缩写 词 看 起 来 眼花 综 乱 ， 实 际 上 其 中 非常 有 规律 性 。 首 字母 缩写 间 的 第 一 
部 分 指 该 标准 的 速率 : 10, 100, 1000 或 10G， 分 别 代 表 10Mbps 、100Mbps 、1000Mbps 
(或 1Gbps) 和 10Cbps 以 太 网 -“BASE” 指 基带 以 太 网 ， 这 意味 着 该 物理 媒体 仅 承载 以 太 
网 流量 ; 几乎 所 有 的 802. 3 标准 都 适用 于 基带 以 太 网 。 该 首 字 母 缩写 词 的 最 后 一 部 分 指 物 
SHEAR AS Es 以 太 网 是 链 路 层 也 是 物理 层 的 规范 ， 并 且 能 够 经 各 种 物理 媒体 (包括 同 轴 电 
缆 、 钢 线 和 光纤 ) 承载 。 一 般 而 言 ,“T” 指 双 绞 铜 线 。 

从 历史 上 讲 ， 以 太 网 最 初 被 构想 为 一 段 同 轴 电 缆 。 早期 的 10BASE-2 和 10BASE-5 标 
准 规定 了 在 两 种 类 型 的 同 轴 电缆 之 上 的 10Mbps 以 太 网 ， 每 种 标准 都 限制 在 500 米 长 度 之 
内 。 通 过 使 用 转发 器 (repeater) 能 够 得 到 更 长 的 运行 距离 ， 而 转发 需 是 一 种 物理 层 设 备 ， 
它 能 在 输入 端 接收 信号 并 在 输出 闯 再 生 该 信号 。 同 轴 电 缆 很 好 地 对 应 于 我 们 将 作为 一 种 广 
播 媒 体 的 以 太 网 视 网 ， 即 申 一 个 接口 传输 的 所 有 帧 可 在 其 他 接口 收 到 ， 并 且 以 太 网 的 
CSMA/CD 协议 很 好 地 解决 了 多 路 访问 问题 。 结 点 直接 附着 在 电缆 上 ， 万 事 大 吉 啦 ， 我 们 
有 了 一 个 局 域 网 了 ! 

多 年 来 以 太 网 已 经 经 历 了 一 系列 演化 步骤 ,今天 的 以 太 网 非常 不 同 于 使 用 同 轴 电 缆 的 
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初始 总 线 拓扑 的 设计 。 在 今天 大 多 数 的 安装 中 ， 结 点 经 点 对 点 的 由 双 绞 铜 线 或 光纤 线 缆 构 
成 的 线段 与 一 台 交 换 机 相连 ， 如 图 5-15 至 图 5-17 所 示 

在 20 世纪 90 年 代 中 期 ， 以 太 网 被 标准 化 为 100Mbps， 比 10Mbps 以 太 网 快 10 1%. # 
始 的 以 太 网 MAC 协议 和 帧 格式 保留 了 下 来 ， 但 更 高 速率 的 物理 层 被 定义 为 用 铀 线 
(100BASE-T) 和 用 并 纤 (100BASE-FX, IOOBASE-SX, 100BASE-BX). [#| 5-21 显示 了 这 
些 不 同 的 标准 和 共同 的 以 太 网 MAC 协议 和 帧 格式 。100Mbnps 以 太 网 用 双 绞 线 距离 限制 为 
100 米 ， 用 光纤 距离 限制 为 几 千 米 ， 允 许 把 不 同 建筑 物 中 的 以 太 网 交换 机 连接 起 来 。 
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到 5-21 100Mbps 以 太 网 标准 ， 共同 的 链 路 层 ， 不 同 的 物理 层 


吉 比 特 以 太 网 是 对 极为 成 功 的 10Mbps 和 100Mbps 以 太 网 标准 的 扩展 。 吉 比特 以 太 网 
提供 1000Mbps 的 总 数据 速率 ， 与 大 量 已 经 安 半 的 以 太 网 设备 基础 保持 完全 兼容 。 计 比特 
以 太 网 的 标准 称 为 IEEE 802. 3z， 它 完成 以 下 工作 ; 

o 使 用 标准 以 太 网 帧 格式 (参见 网 $-20)， 并 且 后 向 兼容 10BASE-T 与 100BASE-T 

技术 。 这 使 得 吉 比 特 以 太 网 和 现 已 安装 的 以 太 网 设备 基础 很 容易 集成 . 
e 介 许 点 对 点 链 路 以 及 共享 的 广播 信道 ， 如 前 所 述 ， 点 对 点 链 路 使 用 交换 机 ， 而 广 
播 信 道 使 用 集 线 需 。 在 吉 比 特 以 太 网 术 话 中 ， 集 线 央 被 称 为 “ 带 缓存 的 分 配器 ”， 

e 使 用 CSMA/CD 来 共享 广播 信道 。 为 了 得 到 可 接受 的 效率 ， 绪 点 之 间 的 最 大 距离 

必须 严格 限制 。 

o 对 于 点 对 点 信道 ， 允 许 在 两 个 方向 上 都 以 1000Mbps 全 双 工 操作 。 

吉 比 特 以 太 网 最 初 工作 于 光纤 之 上 ,现在 能 够 工作 在 5 类 UTP k E. 10Gbps 以 太 
网 (10GBASE-T) 于 2007 年 已 被 标准 化 卫 ， 可 提供 更 高 的 以 大 局 域 网 能 力 。 

我 们 通过 提出 一 个 问题 来 结束 有 关 以 太 网 技术 的 讨论 ， 这 个 问题 开始 可 能 会 难 倒 你 。 
在 总 线 拓扑 和 基于 集 线 右 的 星 形 拓扑 技术 时 代 ， 以 太 网 很 显然 是 一 种 广播 链 路 (如 5.3 市 
所 定义 )， 其 中 多 个 结 点 同时 传输 时 会 出 现 帆 碰撞 。 为 了 处 理 这 些 碰撞 ， 以 太 网 标准 包括 
了 CSMA/CD 协议 ， 该 协议 对 于 跨越 一 个 小 的 地 理 半径 的 有 线 广播 局 域 网 特别 有 效 。 但 是 
对 于 今天 广 为 使 用 的 以 太 网 是 基于 交换 机 的 星 形 拓扑 ， 采用 的 是 存储 转发 分 组 交换 ， 是 否 
还 真正 需要 一 种 以 太 网 MAC 协议 呢 7 如 我 们 很 快 所 见 ， 交 换 机 协调 其 传输 ， 在 任何 时 候 
决 不 会 问 相 同 的 接口 转发 超过 一 个 帧 . 此 外 ， 现 代 交 换 机 是 全 双 工 的 ， 这 使 得 一 台 交 换 机 
和 一 个 结 点 能 够 在 同时 问 对 方 发 送 帧 而 没有 干扰 换 句 话 说， 在 基于 交换 机 的 以 太 局 域 网 
中 ， 不 会 有 碰撞 ， 因 此 没有 必要 使 用 MAC HRY T! 

如 我 们 所 见 ， 今 天 的 以 太 网 与 Metcalfe 和 Boggs 在 30 多 年 前 构想 的 初始 以 太 网 有 非常 
大 的 不 同 ， 即 速度 已 经 增加 了 3 个 数量 级 ， 以 太 网 帧 承载 在 各 种 各 样 的 媒体 之 上 上 ， 交 换 以 
太 网 已 经 成 为 主流 ， 此 时 甚至 连 MAC 协议 也 经 凋 是 不 必要 的 了 ! 所 有 这 些 还 真正 是 以 太 
网 吗 ? 答案 当然 是 :“ 是 的 ， 根 据 定 义 如 此 .” 然 而， 注意 到 下 列 事实 是 有 趣 的 : 通过 所 有 
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这 些 改 变 ， 的 确 还 有 一 个 历经 30 年 保持 未 变 的 持久 不 变量 ， 即 以 太 网 帧 格式 。 也 许 这 才 
是 以 太 网 标准 的 一 个 直 重要 的 特征 。 


5.4.3 链 路 层 交 换 机 


到 目前 为 止 ， 我 们 有 意 对 交换 机 实际 要 做 的 工作 以 及 它 是 怎样 工作 的 含糊 其 样 。 交 换 
机 的 任务 是 接收 入 链 路 层 帧 并 将 它们 转发 到 出 链 路 ; 我 们 将 在 这 一 节 中 详细 学 习 这 之 种 转发 
nur RIA EHALA GAF P AE HLA S H it 2a: RARI (transparent); 这 就 是 

， 东 主机 /路 由 器 回 另 一 个 主机 /路 由 融 寻 址 一 个 帧 AE Fo) LA), IA 
ne 并 不 知道 某 交 换 机 将 会 接收 该 帧 并 将 它 转发 到 另 一 个 结 点 。 这 些 
概 到 达 该 交换 机 的 任何 输出 接口 之 一 的 速率 可 能 暂时 会 超过 该 接口 的 链 路 容量 。 为 了 解决 
这 个 问题 ， 交 换 机 得 出 接口 设 有 缓存 ， 这 非 币 类 似 于 路 由 硕 接 口 为 数据 报 设 有 缓存 。 现 在 
我 们 来 仔细 考察 交换 机 运行 的 原理 . 

1. 交换 机 转发 和 过 小 

过 滤 (filtering) 是 决定 一 个 帧 应 该 转发 到 某 个 接口 还 是 应 当 将 其 丢弃 的 交换 机 功能 
转发 (forwarding) 是 决定 一 个 帧 应 该 被 导向 哪个 接口 ， 并 把 该 帧 移动 到 那些 接口 的 交换 
机 功能 。 交 换 机 的 过 滤 和 转发 借助 于 交换 机 表 (switch table) 完成 。 该 交换 机 表 包 含 某 局 
域 网 上 某 些 主机 和 路 由 需 的 但 不 必 是 全 部 的 表 项 。 交 换 机 表 中 的 一 个 表 项 包含 : 由 一 个 
MAC 地 址 ; 人 @ 通 回 该 MAC 地 址 的 交换 机 接口 ; 色 ) 表 项 放置 在 表 中 的 时 间 - 图 5$-22 中 显示 
了 图 5-15 中 最 上 方 交 换 机 的 交换 机 表 的 一 个 例子 。 

地 址 


62- FE- F7-11-89- A3 
7C-BA-B2-B4-91-10 
































图 5-22 图 5-15 中 最 上 面 交 换 机 的 交换 机 表 的 一 部 分 


尽管 帧 转发 的 撒 述 听 起 来 类 似 于 第 4 章 讨 论 的 数据 转发 ， 但 我 们 将 很 快 看 到 它们 之 间 
有 重要 的 差异 。 一 个 重要 差异 是 交换 机 转发 分 组 基于 MAC 地 址 而 不 是 基于 IP 地 址 。 我 们 
也 将 看 到 交换 机 表 与 路 由 需 的 转发 表 的 构造 方式 有 很 大 差别 。 
为 了 理解 交换 机 过 滤 和 转发 的 工作 过 程 ， 假 定 目 的 地 址 为 DD-DD-DD-DD-DD-DD 的 
帧 从 交换 机 接口 x 到 达 ， 交换机 用 MAC 地 址 DD- DD- DD- DD- DD-DD 索引 它 的 表 。 有 3 种 
可 能 的 情况 
e 表 中 没有 对 于 DD-DD-DD-DD-DD-DD 的 表 项 。 在 这 种 情况 下 ， 交 换 机 向 除 接 口 x 
外 的 所 有 接口 前 面 的 输出 缓存 转发 该 帧 的 副本 换言之， 如 果 没 有 对 于 目的 地 址 
的 表 项 ， 交 换 机 广播 该 帧 . 
e 表 中 有 一 个 表 项 将 DD-DD-DD-DD-DD-DD 与 接口 x 联系 起 来 。 在 这 种 情况 下 ， 该 
帧 从 包括 适配器 DD-DD- DD- DD- DD-DD 的 局 域 网 网 段 到 来 。 无 需 将 该 帧 转发 到 任 
何其 他 接口 ， 交 换 机 通过 丢弃 该 帧 执行 过 滤 功 能 即 可 。 
© 表 中 有 一 个 表 项 将 DD-DD-DD-DD-DD-DD 与 接口 yx 联系 起 来 。 在 这 种 情况 下 ， 
该 帖 震 要 被 转发 到 与 接口 y 相连 的 局 域 网 网 段 。 交 换 机 通过 将 该 帧 放 到 接口 y 前 
面 的 输出 缓存 完成 转发 功能 。 
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Fl | Bch a — PAPI] 5-15 中 最 上 面 交换 机 的 这 些 规则 以 及 图 5-22 中 所 示 的 它 的 
交换 机 表 。 假设 目的 地 址 为 62-FE-F7-11-89- A3 的 一 个 帧 从 接口 1 到 达 该 交换 机 。 交 换 机 
检查 它 的 表 并 且 发 现 其 目的 地 是 在 与 接口 1 相连 的 局 域 网 网 段 上 ( 即 电子 工程 系 的 局 域 
网 ) 。 这 意味 着 该 帧 已 经 在 包含 目的 地 的 局 域 网 网 段 广 播 过 了 .因此 该 交换 机 过 滤 (AE 
F) 了 该 帧 .现在 假设 有 同样 目的 地 址 的 帧 从 接口 2 到 达 。 交换 机 再 次 检查 它 的 表 并 且 发 
现 其 目的 地 址 在 接口 1 的 方向 上 ; 因此 它 向 接口 1 前 面 的 输出 缓存 转发 该 帧 。 这 个 例子 清楚 
地 表明 ， 只 要 交换 机 的 表 是 完整 和 准确 的 ， 该 交换 机 无 需 任 何 广 播 就 向 看 日 的 地 转发 帧 。 

在 这 种 意义 上 上， 交换机 比 集 线 需 更 为 “聪明 ”- 但 是 一 开始 这 个 交换 机 表 是 如 何 配 置 
起 来 的 呢 ? 链 路 层 有 与 网 络 层 路 由 选 择 协 议 等 价 的 协议 吗 ?” 或 者 必须 要 一 名 超人 负 集 工作 的 
管理 员 人 工地 配置 交换 机 表 吗 ? 

2, HFA 

交换 机 有 具有 令 人 局 奇 的 特性 FEIER FP os fay CEIR eo), IE 
的 表 是 目 动 、 动 态 和 目 治 地 建立 的 ， 即 没有 来 目 网 络 管理 员 或 来 目 配 置 协议 的 任何 十 预 
换 名 话说， 交换 机 是 自学 习 (self-learning) 的 .这 种 能 力 是 以 如 下 方式 实现 的 : 

1 ) 交换 机 表 初 始 为 空 。 

2) 对 于 在 每 个 接口 接收 到 的 每 个 人 帧 ， 该 交换 机 在 其 表 中 存储 : 人 在 该 帧 源 地 址 字 
段 中 的 MAC 地 址 ; 他 该 帧 到 达 的 接口 ; (3 当前 时 间 。 交换 机 以 这 种 方式 在 它 的 表 中 记录 
了 发送 绪 点 所 在 的 局 域 网 网 段 。 如 果 在 局 域 网 上 的 每 个 结 点 最 终 都 发 送 了 一 个 帧 ， 则 每 个 
结 点 最 终 将 在 这 张 表 中 留 有 记录 。 

3) 如 果 在 一 段 时 间 ( 称 为 老化 期 (aging time)) 后 ， 交 换 机 没有 接收 到 以 该 地 址 作 
为 源 地 址 的 帧 ， 就 在 表 中 删除 这 个 地 址 。 以 这 种 方式 ， 如 果 一 台 PC 被 男 一 台 PC (具有 不 
同 的 适配器 ) 代替 ， 原 来 PC 的 MAC 地 址 将 最 终 从 该 交换 机 表 中 被 清除 掉 。 

我 们 粗略 地 看 一 下 用 于 图 5-15 中 最 上 面 交 换 机 的 自学 习性 质 以 及 在 图 5$-22 中 它 对 应 
的 交换 机 表 。 假 设 在 时 刻 9:39， 源 地 址 为 01-12-23-34-45-56 的 一 个 帧 从 接口 2 到 达 。 假 
设 这 个 地 址 不 在 交换 机 表 中 。 于 是 交换 机 在 其 表 中 增加 一 个 新 的 表 项 ， 如 图 5-23 中 所 示 . 


地 址 接口 时 间 
01-12-23-34-45. 56 2 9: 39 
62-FE-F7-11-89- A3 | 9: 32 
7C-BA-B2-B4-91-10 3 9: 36 








i 


图 5-23 交换 机 学 习 到 地 址 为 01-12-23-34-45-56 HE AC Ak IT E AJG E 


继续 这 个 例子 ,假设 该 交换 机 的 老化 期 是 60 分 钟 , 在 9:32 ~ 10: 32 期 间 源 地 址 是 
62-FE-F7-11-89- A3 的 帧 没有 到 达 该 交换 机 。 那 么 在 时 刻 10: 32， 这 台 交 换 机 将 从 它 的 表 
中 删除 该 地 址 。 

交换 机 是 即 插 即 用 设备 (plug-and-play device) ， 因 为 它们 不 需要 网 络 管理 员 或 用 户 的 
干预 。 要 安装 交换 机 的 网 络 管理 员 除 了 将 局 域 网 网 段 与 交换 机 的 接口 相连 外 ， 不 需要 做 其 
他 任何 事 。 管 理 员 在 安装 交换 机 或 者 当 某 主机 从 局 域 网 网 段 之 一 被 去 除 时 ， 他 没有 必要 本 
置 交 换 机 表 。 交 换 机 也 是 双 工 的 ， 这 意味 着 任何 交换 机 接口 能 够 同时 发 送 和 接收 。 
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3.， 链 路 层 交 换 机 的 性 质 

在 描述 了 链 路 层 交 换 机 的 基本 操作 之 后 .我 们 现在 来 考虑 交换 机 的 特色 和 人 性质。 我 们 
能 够 指出 使 用 交换 机 的 几 个 优点 ， 它 们 不 同 于 如 总 线 或 基于 集 线 需 的 星 形 拓扑 那样 的 广播 
HEIR : 

e 消除 碰撞 。 在 使 用 交换 机 EHRE A ERJA, 8c Fy AREE N 
的 带宽 ! 交换 机 缓存 帧 并 且 决 不 会 在 网 段 上 同时 传输 多 于 一 个 帧 。 就 像 使 用 路 由 
器 一 样 ， 交 换 机 的 最 大 聚合 带宽 是 该 交换 机 所 有 接口 速率 之 和 。 因 此 ， 交 换 机 提 
供 了 比 使 用 广播 链 路 的 局 域 网 高 得 多 的 性 能 改善 

o 异 质 的 链 路 .交换机 将 链 路 彼此 隔离 ， 因 此 局 域 网 中 的 不 同 链 路 能 够 以 不 同 的 速 
率 运 行 并 且 能 够 在 不 同 的 媒体 上 运行 。 例 如， 网 5-22 中 最 上 面 的 交换 机 有 3 条 
1Gbps 1000BASE- T 铜 缆 链 路 、2 条 100Mbps 1OBASE- FX 光缆 链 路 和 1 条 100 
BASE-T 铜 线 链 路 。 因 此 ， 对 于 原 有 的 设备 与 新 设备 混用 ， 交换机 是 理想 的 

e 管理 .除了 提供 强化 的 安全 性 ( 参见 插入 材料 “关注 安全 性 ”) ， 交 换 机 也 易于 进 
行 网 络 管理 . 例如， 如果 一 个 适 配 带 工作 异常 并 持续 发 送 以 太 网 巾 ( 称 为 快 而 含 
糊 的 (jabbering) 适 配 费 )， 交 换 机 能 够 检测 到 该 问题 ， 并 在 内 部 断 开 寞 第 适 配 
aro A TRPE., 网 络 管理 员 不 用 起 床 并 开车 到 工作 场所 去 解决 这 个 问题 。 类 
似 地 ， 一 条 割断 的 缆 线 仅 使 得 使 用 该 条 缆 线 连接 到 交换 机 的 主机 断 开 连接 .在 使 
用 同 轴 电 弦 的 时 代 ， 许 多 网 络 管 理 员 花 费 几 个 小 时 “沿线 巡 检 ” (或 者 更 准确 地 
说 “在 天 花 板 上 扑 行 ")， 以 找到 使 整个 网 络 竣 痪 的 电缆 断 开 之 处 。 如 在 第 9 草 
(网 络 管理 ) 中 讨论 的 那样 ， 交换 机 也 收集 市 宽 使 用 的 统计 数据 、 人 页 撞 率 和 流量 类 
型 ， 并 使 这 些 信 息 为 网 络 管理 者 使 用 。 这些 信 息 能 够 用 于 调试 和 解决 问题 ， 并 规 
划 该 局 域 网 在 未 来 应 当 演 化 的 方式 。 研 究 人 员 还 在 原型 系统 部 党 中 探讨 在 以 太 局 
域 网 中 增加 更 多 的 管理 功能 [Casado 2007; Koponen 2011 | 





嗅 探 交 换 局 域 网 : 交换 机 毒化 


当 一 台 主 机 与 某 交 换 机 相连 时 ， 它 通常 仅 接收 到 明确 发 送 给 它 的 帧 ， 例如， 考虑 在 
图 $-17 中 的 一 个 交换 局 域 网 ， 当 主机 上 A 向 主机 B 发 送 帧 时 ， 在 交换 机 表 中 有 用 于 主机 
B 的 表 项 ， 则 该 交换 机 将 仅 向 主机 BB 转发 该 帧 。 如 果 主 机 ([C 恰好 在 运行 嗅 探 器 ， 主 机 C 
将 不 能 够 嗅 探 到 A 到 BB 的 帧 。 因此， 在 交换 局 域 网 的 环境 中 (与 如 802.11 局 域 网 或 基 
于 集线器 的 以 太 局 域 网 的 广播 链 路 环境 形成 对 比 ) ， 攻 击 者 噢 探 帧 更 为 困难 ， 然而， 因 
为 交换 机 广播 那些 目的 地 址 不 在 交换 机 表 中 的 帧 ， 位 于 C 上 的 噢 探 器 仍然 能 嗅 探 某 些 不 
是 明确 寻 址 到 C a. 此 外 ， 嗅 探 器 将 能 够 噢 探 到 具有 广播 地 址 FF-FF-FF-FF-FF-EFTF 的 
广播 帧 ， 一 个 众所周知 的 对 抗 交 换 机 的 攻击 称 为 交换 机 毒化 (switch poisoning ) , 它 向 区 
换 机 发 送 大 量 的 具有 不 同 伪 造 源 MAC 地 址 的 分 组 ， 因 而 用 伪造 表 项 填 满 了 交换 机 表 ， 
没有 为 合法 主机 留 下 空间 。 这 使 该 交换 机 广播 大 多 数 帧 ， 这 些 帧 则 能 够 由 嗅 探 器 停 获 到 
[ Skoudis 2006]. 由 于 这 种 攻击 只 有 技艺 高 超 的 攻击 者 才能 做 到 ， 因 此 交换 机 比 起 集 线 
器 和 无 线 局 域 网 来 更 难受 到 嗅 探 。 
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4. 交换 机 和 路 由 如 比较 
如 我 们 在 第 4 间 学 习 的 那样 ， 路 由 幽 是 使 用 网 络 层 地 址 转发 分 组 的 存储 转发 分 组 交换 
HL. 尽管 交换 机 也 是 一 个 存储 转发 分 组 交换 机 ， 但 它 和 路 由 需 是 根本 不 同 的 ， 因 为 它 用 
MAC 地 址 转发 分 组 .交换 机 是 第 二 层 的 分 组 交换 机 ， 而 路 由 涯 是 第 三 层 的 分 组 交换 机 ， 
即使 交换 机 和 路 由 需 从 根本 上 是 不 同 的 ， 网 络 管理 员 在 安装 互联 设备 时 也 经 凋 必 
它们 之 间 进 行 选 择 ， 例 如 ， 对 于 图 $-15 中 的 网 络 ， 网 络 管理 员 本 来 可 以 很 容易 地 使 用 
由 融 而 不 是 交换 机 来 互联 各 个 系 的 局 域 网 、 服 务 锅 和 互联 网 网 关 路 由 需 ， 路 由 es 
和 谷 系 之 问 通 信和 而 不 产生 健 撞 ， 既 然 交 换 机 和 路 由 釉 都 是 候选 的 互联 设备 ， 那 么 这 两 种 方式 
的 优点 和 缺点 各 是 什么 呢 ? 
首先 考虑 交换 机 的 优点 和 缺点 。 如 上 上 面 提 到 的 那样 ， 交 换 机 是 即 插 即 用 的 ,这 是 世界 
所 有 超人 钠 伍 工 作 的 网 络 管理 员 都 豆 爱 的 特性 。 交 换 机 还 能 够 具有 相对 高 的 分 组 过 滤 和 转 
aa 就 像 图 5-24 PAN AY AB RE, 2 FR Ls Zul cb FA ay EPA A MOT, T ee H ti a Zu Wh 
Fey eB Jaši fe TI, A IE MAJAA, ZER 2K A KATP BR hi 
HERRERA FB PY 0 R A 2 BE OR E E LAS FH AP A KAI ARP K, 5 
生成 可 观 的 ARP jitter Alb Be i MH, ZREL FR UR IF OAS BE EE faf TR E E , 
如 果 某 主机 出 了 故障 并 传输 出 设 完 没 了 的 以 太 网 广播 帆 流 ， 该 交换 机 将 转发 所 有 这 ty 
Hi FE LAK DY HA Pe o 
主机 主机 










| 应 用 | 六 应 用 层 








各 5-24 在 交换 机 、 路 由 此 和 主机 中 分 组 的 处 理 


现在 考虑 路 由 占 的 优点 和 和 缺 点。 因为 网 络 寻 址 通 贡 是 分 层次 的 〈 不 像 MAC 寻 址 那样 
是 局 平 的 )， 即 使 当 网 络 中 存在 元 余 路 人 径 时 ， 分 组 通常 也 不 会 通过 路 由 右 循 环 。( 然而 ， 当 
路 由 天 表 被 误 配 置 时 ， 分 组 可 能 循环 ; 但 是 如 我 们 在 第 4 EA, IP 用 一 个 特殊 的 报 文 首 
部 字段 来 限制 循环 . ) 所 以 ， 分 组 就 不 会 被 限制 到 一 棵 生成 树 上 ， 并 可 以 使 用 源 和 目的 地 
之 同 的 最 佳 路 人 径 。 因 为 路 由 此 没有 生成 树 限制 ， 所 以 它们 允许 以 丰富 的 拓扑 结构 构建 因 特 

， 例 如 包括 欧洲 和 北美 之 间 的 多 条 活跃 链 路 。 路 由 融 的 男 一 个 特色 是 它们 对 第 二 层 的 广 
ff 风暴 是 供 了 防火 墙 保 护 : 尽管 也 许 路 由 硕 最 重要 的 缺点 就 是 它们 不 是 即 插 即 用 的 ， 即 足 
有 由 天 和 连接 到 它们 的 主机 都 a IP 地 址 ， 而 且 路 由 需 对 每 个 分 组 的 处 理 时 间 
通 第 比 交 换 机 更 长 ， 因 为 它们 必须 处 理 高 达 第 三 层 的 字段 。 最后， 路 由 器 一 词 有 两 种 不 同 
的 发 音 方 法 ， 或 者 发 音 为 “rootor” ie “rowter”， 人 们 浪费 了 许多 时 间 争 论 正 确 的 
发 音 | Perlman 1999 |. 

给 出 子 交换 机 和 路 由 需 各 日 具有 的 优点 和 缺点 后 (总结 在 表 5-1 中 ) ， 一 个 机 构 的 网 
络 ( 例 如， 大 学 校园 网 或 者 公司 园区 网 ) 什么 时 候 应 该 使 用 交换 机 ， 什 么 时 候 应 该 使 用 路 
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MELLEI T, ANETAR IP 地 址 的 任何 配置 就 能 使 流量 局 部 化 并 增加 总 计 存 吐 量 ， 
但 是 在 由 几 千 人 台 主 机 组 成 的 更 大 网 络 中 .通常 在 网 络 中 (| 除了 交换 机 之 外 ) 还 包括 路 由 
各 -路 由 咒 提 供 了 更 健壮 的 流量 隔离 方式 和 对 广播 风暴 的 控制 ， 并 在 网 络 的 主机 之 间 使 用 
更 “智能 的 ”路 由 

对 于 交换 网 络 和 路 由 网 络 的 优 缺 点 的 进 表 5-1 流行 的 互联 设备 的 典型 特色 的 比较 
一 步 讨论 ， 以 及 如 何 能 够 将 交换 局 域 网 技术 一 _ ee MBR SERA 





vat | F ya 离 S 1 一 
扩展 为 比 今天 的 以 太 网 容纳 多 两 个 数量 级 以 cei : je 
of) THT be 
上 的 主机 ， 人 参见 | Meyers 2004; Kim 2008 | . iL bch ‘ 3 h 


5.4.4 虚拟 局 域 网 


ERII] 5-15 的 讨论 中 、 我 们 注 和 T a ee AC AY ye RY 
每 个 工作 组 (部 门 ) 有 自己 的 交换 局 域 网 ， 经 过 一 个 交换 机 等 级 结构 与 其 他 工作 组 的 交换 
局 域 网 互联 。 里 然 这 样 的 配置 在 理想 忆 界 中 能 够 很 好 地 工 E, {ACERS EL FE aE HY ASS MILA 


意 。 在 图 5-15 中 的 配置 中 ， ahi 3 个 缺点 : 
e ae 里 hes 离 IR FF | 结构 把 组 流 元 ur 局 域 化 至 I|- A 单 - ce 交换 机 中 ， 但 广播 fit 


(filanti ARP ai iiai et Aa 有 被 目 学 习 交 换 机 学 习 到 的 
) 仍然 必须 跨越 整个 机 构 网 络 。 限 制 这 些 广播 流量 的 范围 将 改善 局 域 网 的 性 能 . 
也 许 更 为 重要 的 是 ， 为 了 安全 /隐私 的 目的 也 可 能 希望 限制 局 域 网 广播 流量 。 例 
如 ， 如 果 一 个 组 包括 公司 的 行政 管理 团队 ， 另 一 个 组 包括 运行 大 Wireshark 分 组 噢 
探 货 的 心怀 不 满 的 雁 员 ， 网 络 管理 员 也 许 非常 希望 行政 流量 无 法 到 达 该 雁 员 的 主 
机 ,通过 用 路 由 费 代 替 图 5-15 中 的 中 心 交 换 机 ， 能 够 提供 这 种 类 型 的 陶 离 .我 们 

很 快 看 到 这 种 隔离 也 能 够 经 过 一 种 交换 (第 2 层 ) 解决 方案 来 取得 . 
o 交 挽 机 的 无 效 使 用 。 如 果 该 机 构 不 止 有 3 个 组 ， 而 是 有 10 个 组 ， 则 将 要 求 有 10 
个 第 一 级 交换 机 。 如 果 每 个 组 都 较 小 ， 比 如 说 少 于 10 个人， 则 单 台 96 请 目的 区 

换 机 将 足以 容纳 每 个 人 ， 但 这 台 单 一 的 交换 机 将 不 能 提供 流量 隔离 
e 管理 用 户 ， 如 果 一 个 雇员 在 不 同 组 间 移 动 ， 必 须 改变 物 理 布线 ， 以 将 该 雇员 连接 

BIL 5-15 中 的 不 同 的 交换 机 上 。 属于 两 个 组 的 座 员 将 使 问题 更 为 困难 

垃 运 的 是 ， 这 些 难 题 中 的 每 个 都 能 够 通过 支持 虚拟 局 域 网 (Virtula Local Network, 
VLAN) 的 交换 机 来 处 理 。 顾名思义 ， 支 持 VLAN 的 交换 机 允许 经 一 个 单一 的 物理 局 域 网 
基础 设施 定义 多 个 虚拟 局 域 网 ， 在 一 个 
VLAN 内 的 主机 彼此 通信 ,仿佛 它们 〈 并且 
没有 其 他 主机 ) 与 交换 机 连接 。 在 一 个 基于 
vig AY VLAN 中 ,交换机 的 端口 (接口 ) 由 
网 络 管理 员 划 分 为 组 ,每 个 组 构成 一 个 
VLAN， 在 每 个 VLAN 中 的 端口 形成 一 个 广 
播 域 〈 即 来 日 一 个 端口 的 广播 流量 仅 能 到 达 





ZA PAY HbO). 5-25 显示 了 有 具有 16 电子 工程 系 计算 机 科学 系 
个 端口 的 单一 交换 机 。 端口 a 8 属于 电子 (VLAN 端口 2 ~ &) (VLAN MH 119 ~ 15) 


THEA (EE) VLAN, WH 9 ~ 15 属于 计 图 5-25 ”配置 了 两 个 VLAN 的 单 台 交换 机 
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算 机 科学 系 (CS)VLAN (端口 1 和 16 未 分 配 ) 。 ~ VLAN 解决 了 上 面 提 到 的 所 有 困难 ， 
HJ EE VLAN 帧 和 CS VLAN 帧 彼此 隅 离 ， 图 $-15 ee 并 
且 在 交换 机 端口 8 的 用 户 加 入 计算 机 科学 系 时 ， 网 络 操作 员 只 需 重 新 配置 VLAN 软件 ， 使 
得 端口 8 与 CS VLAN 相关 联 即 可 。 人 们 容易 想象 到 VLAN 交换 机 配置 和 操作 的 方法 ， 即 
网 络 管理 员 使 用 交换 机 管理 软件 声明 一 个 端口 属于 某 个 给 定 的 VLAN (HR AH A i H 
属于 一 个 默认 的 VYLAN)， 在 交换 机 中 维护 一 张 端口 到 VLAN 的 映射 表 ; 交换 机 软件 仅 在 
属于 相同 VLAN 的 端口 之 间 交 付 帧 。 

但 完全 隔离 两 个 VLAN 带 来 了 新 的 困难 ! 来 自 电 子 工程 系 的 流量 怎样 才能 发 送 到 计算 
机 科学 系 呢 ? 解决 这 个 问题 的 一 种 方式 是 将 VLAN 交换 机 的 一 个 端口 (例如 在 图 5-25 中 
的 端口 1) 与 一 台 外 部 的 路 由 需 相 连 ， 并 且 将 该 闯 口 配置 为 属于 EE VLAN 和 CS VLAN. 
在 此 情况 下 ， 即 使 电子 工程 系 和 计算 机 科学 系 共 享 相 同 的 物理 交换 机 ， 其 网 辑 配 置 看 起 来 
也 仿佛 是 电子 工程 系 和 计算 机 科学 系 具 有 分 离 的 经 路 由 需 连 接 的 交换 机 。 从 电子 工程 系 发 
往 计 算 机 科学 系 的 数据 报 将 首先 跨越 EE VLAN 到 达 路 由 需 ， 然 后 由 该 路 由 大 转发 跨越 CS 
VLAN 到 达 CS 主机 。 和 幸运 的 是 交换 机 广 商 使 这 种 配置 变 得 容 多 ， 网 络 管理 员 通 过 构建 包 
含 一 台 VLAN 交换 机 和 一 台 路 由 上 需 的 单一 设备 ， 这 样 就 不 再 需要 分 离 的 外 部 路 由 需 了 了 - 本 
章 后 面 的 课 后 习题 中 更 为 详细 地 探讨 了 这 种 情况 。 

再 次 返回 到 图 $-15 ， 我 们 现在 假设 计算 机 工程 系 没 有 分 离开 来 ， 某 些 电 子 工程 和 计算 
机 科学 教职员 工 位 于 一 座 建 筑 物 中 ， 他 们 当然 需要 网 络 接 入 ， 并 且 他 MARA 
VLAN 的 一 部 分 。 图 5-26 显示 了 第 二 台 8 mL, HPRH H EO ARE mi e E X 
为 属于 EE VLAN 或 CS VLAN。 但 是 这 两 台 交 换 机 应 当 如 何 互 联 呢 ? 一 种 容易 的 解决 方案 
是 在 每 台 交 换 机 上 定义 一 个 属于 CS VALN 的 端口 (对 EE VLAN th (ab), JF Aon 
图 5-26a 所 示 将 这 两 个 端口 彼此 互联 起 来 。 然 而， 这 种 解决 方案 不 具有 扩展 性 ， 因 为 在 每 
BOCAL N ANLAN SERE A PAE EERE aeons 





电子 工程 系 。 计算 机 科学 系 电子 工程 系 计算 机 科学 系 


(VLAN 端口 2~ 8) (VLAN 端 口 9 ~ 15) (VLAN 端口 2~8) ”VLAN 端口 9 ~ 15) 
b) 干线 


图 5-26 连接 具有 两 个 VLAN 的 两 台 VLAN 交换 机 


一 种 更 具 扩 展 性 互联 VLAN 交换 机 的 方法 称 为 VLAN 干线 连接 (VLAN trunking), 在 
图 5-26b 所 示 的 VLAN 干线 方法 中 ， 每 台 交 换 机 上 的 一 个 特殊 疹 口 〈 左 侧 交 换 机 上 的 端口 
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16， 右 侧 交 换 机 上 的 端口 1) 被 配置 为 干线 端口 ， 以 互联 这 两 台 VLAN 交换 机 ,该 干线 端 
口 属于 所 有 VLAN， 发 送 到 任何 VLAN 的 帧 经 过 十 线 链 路 转发 到 其 他 交换 机 。 但 这 会 引起 
男 外 的 问题 ; 一 个 交换 机 怎样 知道 到 达 十 线 痛 口 的 帆 属 于 某 个 特定 的 VLAN We? TERE 定 
义 了 一 种 扩展 的 以 太 网 帆 格 式 一 一 802. 10Q， 用 于 跨越 VLAN 干线 的 帧 。 如 图 5-27 中 所 示 ， 
802. 1Q 帧 由 标准 以 太 网 帧 与 加 进 首 部 的 4 字 节 VLAN 标签 (VLAN tag) 组 成 ， 而 VLAN 
祭 签 承载 着 该 帧 所 属 的 VLAN PRIIT. VLAN 标签 由 在 VLAN 干线 发 送 侧 的 交换 机 加 进 帧 
ft, eae EERE VDAN Tore ein ue reer E saat die ae 
ee 1! 符 (Tag Protocol Identifier, TPID) 字段 (具有 固定 的 十 六 进 制 值 81 -00) 、 

节 的 标签 控制 信息 字段 (包含 一 个 12 nen VLAN 标识 符 字段 ) 和 一 个 3 比特 m 
BA rE (具有 类 似 于 1IP 数据 报 TOS 字段 的 目的 ) 组 成 。 








类 型 
Ne Bete met RE 
Oo XM i 
| se ee: 
慰 签 协 议 标识 得 重 计算 的 CRT 


图 5-27 初始 的 以 太 网 帧 (上 部 )，802. 10 标签 以 太 网 VLAN Wi (下 部 ) 


在 这 部 分 讨论 中 ， 我 们 仅仅 简要 地 涉及 了 VLAN， 关 注 了 基于 端口 的 VLAN。 我 们 也 
应 当 提 及 VLAN 能 够 以 几 种 其 他 方式 定义 。 在 基于 MAC 的 VLAN 中 ， 网 络 管理 员 指定 必 
于 每 个 VLAN 的 MAC 地 址 的 集合 ; 无 论 何 时 一 个 设备 与 一 个 问 口 连接 时 ， 端 口 基于 设备 
的 MAC 地 址 将 其 连接 进 适 当 的 VLAN, VLAN 也 能 基于 网 络 层 协议 (例如 IPv4、IPv6 或 
Appletalk ) 和 其 他 准则 进行 定义 。 详 情 请 参见 802.10 标准 | IEEE 802. 1q 2005 | 。 


5.5 链 路 虚拟 化 : 网 络 作为 链 路 层 


因为 本 章 关 注 链 路 层 协议 ， 所 以 在 我 们 临近 该 章 结束 的 时 候 ， 让 我 们 反思 一 下 对 已 经 
演化 的 词汇 链 路 的 理解 。 在 本 草 开 始 时 ， 我 们 将 链 路 视 为 连接 两 台 通信 主机 的 物理 线路 -。 
在 学 习 多 路 访问 协议 时 ， 我 们 看 到 了 多 台 主 机 能 够 通过 一 条 共享 的 线路 连接 起 来 ， 并 且 连 
接 主机 的 这 种 “线路 ”能 够 是 无 线 电 频 谱 或 其 他 媒体 。 这 使 我 们 将 该 链 路 更 多 地 抽象 为 一 
条 信道 ， 而 不 是 作为 一 条 线路 。 在 我 们 学 习 以 太 局 域 网 时 (图 5-15)， 我 们 看 到 互联 媒体 
实际 上 能 够 是 一 种 相当 复杂 的 交换 基础 设施 。 然 而 ， 经 过 这 种 演化 ， 主 机 本 刁 维 持 着 这 样 
的 视图 ， 即 互联 媒体 只 是 连接 两 台 ina det ， 我 们 看 到 ， 例 如 一 台 以 太 网 
主机 不 知道 它 是 通过 单一 短 局 域 网 网 段 (图 5-7) 还 是 通过 地 理 上 分 布 的 交换 局 域 网 
(图 5-15) 或 通过 VLAN 与 其 他 局 域 网 主机 进行 连接 ， 这 是 很 幸福 的 事 。 

在 两 台 主 机 之 间 由 拨号 调制 解 调 融 连接 的 场合 ， 连 接 这 两 台 主 机 的 链 路 实际 上 是 电话 
网 ， 这 是 一 个 逻辑 上 分 离 的 、 全 球 性 的 电信 网络 ， 它 有 自己 的 用 于 数据 传输 和 信 令 的 交换 
机 、 链 路 和 协议 栈 。 然 而 ， 从 因特网 链 路 层 的 观点 看 ， 通 过 电话 网 的 拨号 连接 被 看 做 一 根 
简单 的 “线路 "”。 在 这 个 意义 上 ， 因 特 网 虚拟 化 了 电话 网 ， 将 电话 网 看 成 为 两 台 因 特 网 主 
机 之 间 提 供 链 路 层 连 接 的 链 路 层 技术 。 你 可 能 回想 起 在 第 2 草 中 对 于 窗 盖 网 络 的 讨论 ， 类 


a 
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es ha HEL bi PA EV) A TE Pr OR RE ne DAD SP. 

在 本 节 中 ， 我 们 将 考虑 多 协议 标签 交换 (MPLS) 网 络 。 与 电路 交换 的 电话 网 不 同 ， 
MPLS 客观 上 讲 是 一 种 分 组 交换 的 虚 电 路 网 络 。 它 们 有 自己 的 分 组 格式 和 转发 行为 。 因 此 ， 
从 教学 法 的 观点 看 ， 有 关 MPLS 的 讨论 既 适 合 放 在 网 络 层 的 学 习 中 ， 也 适合 放 在 链 路 层 的 
学 习 中 。 然而 ， 从 因特网 的 观点 看 ， 我 们 能 够 认为 MPLS 像 电 话 网 和 交换 以 太 网 一 样 ， 作 
为 为 IP 设备 提供 互联 服务 的 链 路 层 技 术 ， 因此， 我 们 将 在 链 路 层 讨 论 中 考虑 MPLS, Wip 
继 和 ATM 网 络 也 能 用 于 互联 IP 设备 ,虽然 这 些 技术 看 上 去 有 些 过 时 (AAG CER), X 
里 将 不 再 讨论 ; 详情 请 参见 一 本 可 读 性 强 的 书 [Goralski 1999 ] .我 们 对 MPLS 的 讨论 将 是 
简明 扼要 的 ， 因 为 有 关 这 些 网 络 每 个 都 能 够 写 (并 且 已 经 写 了 ) MEAS. 有 关 MPLS 详情 
我 们 推荐 [ Davie 2000]. 我们 这 里 主要 关注 这 些 网 络 怎样 为 互联 IP 设备 提供 服务 ， 尺 管 
我 们 也 将 更 深入 一 些 探讨 支撑 基础 技术 . 


多 协议 标签 交换 


通过 采用 虚 电 路 网 络 领域 的 一 个 关键 概 念 回 定 长 度 标 签 ， 多 协议 标签 交换 ( Mul- 
liprotocol Label Switching, MPLS) 目 20 直 纪 90 年 代 中 后 期 在 一 些 产 业界 的 努力 下 进行 演 
化 ， 以 改善 JP 路 由 需 的 转发 速度 .其 目标 是 : 对 于 基于 同 定 长 度 标签 和 虚 电 路 的 技术 ， 
在 不 放弃 基于 目的 地 IP 数据 报 转发 的 基础 设施 的 前 提 下 ， 当 可 能 时 通过 选择 性 地 标识 数据 
报 并 允许 路 由 带 基 于 固定 长 度 的 标签 (而 不 是 目的 地 IP 地址 ) 转发 数据 报 来 增 哩 其 功能 ， 
重要 的 是 ， 这 些 技术 与 IP 协同 工作 ,使 用 IP 寻 址 和 路 由 选择 。IETF 在 MPLS 协议 中 统一 了 
这 些 努 力 [ RFC 3031; RFC 3032], ， 有 效 地 将 虚 电路 技术 综合 进 了 路 由 选择 的 数据 报 网 络 。 

首先 考虑 由 MPLS 使 能 的 路 由 需 处 理 的 链 路 层 帧 格式 ， 以 此 开始 学 习 MPLS, [A] 5-28 
显示 了 了 在 MPLS 使 能 的 路 由 硕 之 间 传 输 的 一 个 链 路 层 帧 ， 该 病 具 有 一 个 小 的 MPLS Fah, 
该 汕 部 增加 到 第 二 层 ( 如 以 太 网 ) 首部 和 第 三 层 ( 即 正 ) 首部 之 间 。RFC 3032 定义 了 用 
于 这 种 链 路 的 MPLS 首部 的 格式 ; 用 于 ATM 和 帧 中 继 网 络 的 首部 也 定义 在 其 他 的 RFC X 
RiP. 包括 在 MPLS 首部 中 的 字段 是 : 标签 〈 它 起 着 虚 电 路 标识 符 的 作用 ， 我 们 已 经 在 
4. 2. 1 节 中 讨论 过 该 标识 符 ); 3 比特 的 实验 字段 (保留 用 于 实验 ); 单 比特 S 字段 用 于 指 
示 一 系列 “成 栈 ” 的 MPLS 首部 的 结束 (我 们 这 里 不 讨论 这 个 高 级 主题 ); 以 及 寿命 字段 。 








X] 5-28 MPLS 首部 : 位 于 链 路 层 和 网 络 层 首部 之 间 


从 图 5-28 立即 能 够 看 出 ， 一 个 MPLS 加强 的 帧 仅 能 在 两 个 均 为 MPLS 使 能 的 路 由 需 之 
间 发 送 。( 因为 一 个 非 MPLS 使 能 的 路 由 右 ， 当 它 在 期 望 发 现 IP 首部 的 地 方 发 现 了 一 个 
MPLS 首部 时 会 相当 混淆 !) 一 个 MPLS 使 能 的 路 由 带 常 被 称 为 标签 交换 路 由 器 (label- 
switched router) ， 因 为 它 通过 在 其 转发 表 中 查找 MPLS 标签 ， 然 后 立即 将 数据 报 传递 给 适 
当 的 输出 接口 来 转发 MPLS 帧 ， 因 此 ，MPLS 使 能 的 路 由 需 不 需要 提取 目的 IP 地 址 和 在 转 
发 表 中 执行 最 长 前 缀 匹配 的 查找 .但 是 路 由 髓 怎样 才能 知道 它 的 邻居 是 否 的 确 是 MPLS 使 
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E 的 呢 ? PA tie G0 fo] Ae 4 pp SRE IP 目的 地 相 联 系 呢 ?7 为 了 回答 这 些 问 题 ， 我 们 
nt 看 看 一 组 MPLS 使 能 路 由 冀 之 间 的 交互 过 程 - 

在 图 5-29 所 示 的 例子 中 ， 路 由 各 RI 到 R4 部 是 MPLS 使 能 的 ，RS 和 RO 是 标准 的 了 王 路 
rae. RI fe] R2 和 R3 通告 了 它 (R1) 能 够 路 由 到 目的 地 A, can HA MPLS 标签 6 的 接收 
Noi Fe AEA A. Re Ala R3 已 经 回路 由 条 R4 通告 了 它 能 够 路 由 到 月 的 地 A 和 D， 分 
YHA MPLS 标签 10 和 12 AY ADRS I AE A cde, ee A R2 也 回路 由 天 R4 通告 了 
它 (R2) 能 够 到 达 目 的 地 A， 具 有 MPLS 标签 8 的 接收 帧 将 朝 着 A 交换 ， 注 意 到 路 由 需 R4 
现在 处 于 一 个 到 达 A 且 有 两 个 MPLS 路 径 的 令 人 感 兴趣 的 位 置 上 ， 经 接口 0 具有 出 MPLS 标 
答 10， 经 接口 1 具有 出 MPLS 标签 8 在 图 5-29 中 国 出 的 外 围 部 分 是 下 发 备 RS、R6、A 和 
D， 它 们 经 过 一 个 MPLS 基础 设施 (MPLS 使 能 路 由 天 RI, R2, R3 和 R4) 连接 在 一 起 ， 这 
与 一 个 交换 局 域 网 或 ATM 网 络 能 够 将 IP 设备 连接 到 一 起 的 方式 十 分 相似 。 并 且 与 交换 局 域 
网 或 ATM 网 络 相 似 ，MPLS (eRe dt RI 到 R4 完成 这 些 工 作 时 从 没有 接触 分 组 的 IP 首部 ， 
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4] 5-29 加 强 MPLS 的 转发 


在 我 们 上 面 的 讨论 中 ， 们 并 没有 指定 在 MPLS 使 能 路 由 项 之 间 分 布 标签 的 特定 协 

， 因 为 该 信 令 的 细节 已 经 超出 了 本 书 的 范围 然而 ， 我 们 注意 到 ，IETF 的 MPLS 工作 组 
J ap [ RFC 3468 | F RSVP 协议 的 一 种 扩展 ， 称 之 为 RSVP-TE| RFC 3209], È 
将 天 注 对 MPLS 信和 令 所 做 的 工作 。 我 们 也 不 讨论 MPLS 实际 上 是 如 何 计 算 在 MPLS 使 能 路 
由 王 之 间 分 组 的 路 径 的 ， 也 不 讨论 它 如 何 收集 链 路 状态 信息 (例如 ， 未 由 MPLS 预 留 的 链 
路 市 宽 量 ) 以 | 有 于 这 些 路 径 计算 中 。 现 有 的 链 路 状态 路 由 选择 算法 (例如 OSPF) 已 经 扩 
展 为 向 MPLS 使 能 路 由 严 “ 洪 泛 ”。 令 人 感 兴趣 的 是 ， 实 际 路 径 计 算 算 法 没有 标准 化 ， 它 
们 当前 是 厂商 特定 的 算法 。 

hI, 我 们 关于 MPLS 的 讨论 重点 基于 这 样 的 事实 ，MPLS 基于 标签 执行 交换 ， 而 
不 必 考 虑 分 组 的 IP Hehi. 然而 ，MPLS 的 真正 优点 和 当前 对 MPLS 感 兴趣 的 原因 并 不 在 于 区 
换 速 度 的 潜在 增加 ， 而 在 于 MPLS 使 能 的 新 的 流量 管理 能 力 。 如 前面 所 述 ，R4 到 A 具有 两 
条 MPLS 路 径 。 如 有 打转 发 在 IP 层 基于 IP 地 址 执行 ,我 们 在 第 4 章 中 学 习 的 IP 路 由 选择 协议 
将 只 指定 到 A 的 单一 最 小 费用 的 路 径 。 所 以 ，MPLS 提供 了 沿 着 多 条 路 由 转发 分 组 的 能 力 ， 
使 用 标准 IP 路 由 选择 协议 这 些 路 由 将 是 不 可 能 的 。 这 是 使 用 MPLS 的 一 种 简单 形式 的 流量 工 
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程 (traffic engineering) | RFC 3346; RFC3272; RFC 2702; Xiao 2000], ， 其 中 网 络 运行 者 能 
超越 普通 的 IP 路 巾 选择， 迫使 某 些 流量 沿 着 一 条 路 径 朝 着 某 给 定 的 目的 地 引导 ， 并 且 朝 着 
相同 目的 地 的 其 他 流量 沿 厦 另 一 条 路 径流 动 〈 无 论 是 由 于 策略 、 性 能 或 未 些 其 他 原因 ) 。 

将 MPLS 用 于 其 他 目的 也 是 可 能 的 。 能 用 于 执行 MPLS 转发 路 径 的 快速 恢复 ， 例 如 ， 
经 过 一 条 预计 算 的 无 故障 路 径 重 路 由 流量 来 对 链 路 故障 作出 反应 | Kar 2000; Huang 2002; 
RFC 3469]. 最后， 我 们 注意 到 MPLS 能 够 并 且 已 经 被 用 于 实现 所 谓 虚 拟 专用 网 ( Virtual 
Private Network ，VPN ) 。 在 为 用 户 实现 一 个 YPNR 的 过 程 中 ，1SP 使 用 它 的 MPLS 使 能 网 络 
将 用 户 的 各 种 网 络 连 接 在 一 起 。MPLS 能 被 用 于 将 资源 和 由 用 户 的 VPN 使 用 的 寻 址 方式 相 
隔离 ， 其 他 用 户 利用 该 VPN 跨越 该 ISP 网络， 详情 参见 | DeClereq 2002 | 。 

这 里 有 关 MPLS 的 讨论 是 简要 的 ， 我 们 鼓励 读者 参阅 我 们 提 到 的 这 些 文献 。 我 们 注意 
到 对 MPLS 有 许多 可 能 的 用 途 ， 看 起 来 它 将 迅速 成 为 因特网 流量 工程 的 到 士 军刀 ! 


5.6 数据 中 心 网 络 


近年 来 ， 因 特 网 公司 如 谷歌 、 微 软 、 脸 谱 (Facebook) 和 亚马逊 (以 及 它们 在 亚洲 和 欧 
洲 的 同行 ) 已 经 构建 了 大 量 的 数据 中 心 。 每 个 数据 中 心 都 容纳 了 数 万 至 数 十 万 台 主 机 ， 并且 
同时 支持 着 很 多 不 同 的 云 应 用 (例如 搜索 、 电 子 邮 件 、 社 交 网 络 和 电子 商务 )。 每 个 数据 中 
心 都 有 自己 的 数据 中 心 网 络 (data center network ) ， 这 些 数据 中 心 网 络 将 其 内 部 主机 彼此 互 
联 并 与 因特网 中 的 数据 中 心 互联 。 在 本 节 中 ， 我 们 简要 介绍 用 于 云 应 用 的 数据 中 心 网 络 。 

大 型 数据 中 心 的 投资 巨大 ， 一 个 有 100 000 台 主 机 的 数据 中 心 每 个 月 的 费用 超过 1200 万 
美元 [| Greenberg 2009a | 。 在 该 费用 中 ， 用 于 主机 自身 的 开销 占 4$% (每 3 ~4 年 需要 更 新 一 
次 ); 变压器 、 不 间断 电源 系统 、 长 时 间断 电 时 使 用 的 发 电机 以 及 冷却 系统 等 基础 设施 的 开 
销 占 25% ; 用 于 功 耗 的 电力 设施 的 开销 占 15% ; 用 于 联网 的 开销 占 15% ， 这 包括 了 网 络 设 
备 〈 交 换 机 、 路 由 器 和 负载 均衡 设备 ) 、 外 部 链 路 以 及 传输 流量 的 开销 。( 在 这 些 比 例 中 ， 设 
备 费用 是 分 期 偿还 的 ， 因 此 费用 通常 是 由 一 次 性 购买 和 持续 开销 ( 如 能 耗 ) 构成 的 。) 尽管 联 
网 不 是 最 大 的 费用 ， 但 是 网 络 创新 是 减少 整体 成 本 和 性 能 最 大 化 的 关键 [Greenberg 2009a | 。 

主机 就 像 是 数据 中 心 的 工蜂 : 它们 负责 提供 内 容 〈 例 如， 网 页 和 视频 ) ， 存 储 邮 件 和 
文档 ， 并 共同 执行 大 规模 分 布 式 计 算 〈 例 如 ， 为 搜索 引擎 提供 分 布 式 索引 计算 ) 。 数 据 中 
心中 的 主机 称 为 刀片 (blade) ， 与 比萨 饼 盒 类 似 ， 一 般 是 包括 CPU、 内 存 和 磁盘 存储 的 商 
用 主机 。 主 机 被 堆 秋 在 机 架 上 ， 每 个 机 架 一 般 堆 放 20 ~ 40 台 刀 片 。 在 每 一 个 机 架 顶 部 有 
一 台 交 换 机 ， 这 人 台 交 换 机 被 形象 地 称 为 机 架 顶 部 (Top of Rack, TOR) 交换 机 ， 它 们 与 机 
架 上 的 主机 互联 ， 并 与 数据 中 心中 的 其 他 交换 机 互联 。 具 体 来 说 ， 机 架 上 的 每 台 主 机 都 有 
一 块 与 TOR 交换 机 连接 的 网 卡 ， 每 台 TOR 交换 机 有 额外 的 端口 能 够 与 其 他 TOR 交换 机 连 
接 。 尽 管 目前 主机 通常 有 1Cbps 的 以 太 网 与 其 TOR 交换 机 连接 ,但 10Gbps 的 连接 也 许 成 
为 标准 。 每 台 主 机 也 会 分 配 一 个 目 己 的 数据 中 心 内 部 的 EP 地 址 。 

数据 中 心 网 络 支持 两 种 类 型 的 流量 : 在 外 部 客户 与 内 部 主机 之 间 流 动 的 流量 ， 以 及 内 部 
主机 之 间 流 动 的 流量 。 为 了 处 理 外 部 客户 与 内 部 主机 之 间 流 动 的 流量 ， 数 据 中 心 网 络 包括 了 
一 台 或 者 多 台 边 界 路 由 器 (border router)， 它 们 将 数据 中 心 网 络 与 公共 因特网 相连 。 数 据 中 
心 网 络 因此 需要 将 所 有 机 架 彼此 互联 ， 并 将 机 架 与 边界 路 由 顺 连 接 。 图 5-30 显示 了 一 个 数据 
中 心 网 络 的 例子 。 数 据 中 心 网 络 设 计 (data center network design) 是 互联 网 络 和 协议 设计 的 
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图 5-30 具有 等 级 拓扑 的 数据 中 心 网 络 


5. 6. 1 负载 均衡 


一 个 云 数 据 中 心 ， 如 一 个 谷歌 或 者 微软 的 数据 中 心 ， 能 够 同时 提供 诸如 搜索 、 电 子 邮 
件 和 视频 应 用 等 许多 应 用 。 为 了 支持 来 自 外 部 客户 的 请 求 ， 每 一 个 应 用 都 与 一 个 公开 可 见 
的 IP 地 址 关联 ， 外 部 用 户 向 该 地 址 发 送 其 请 求 并 从 该 地 址 接收 啊 应 。 在 数据 中 心 内 部 ， 
外 部 请 求 首 先 被 定向 到 一 个 负载 均衡 器 (load balancer), Hi aly Oy AS WEF E EBL 
请 求 ， 以 主机 当前 的 负载 作为 困 数 来 在 主机 之 间 均 衡 负 载 。 一 个 大 型 的 数据 中 心 通 第 会 丰 
几 台 负载 均衡 器 ， 每 台 服 务 于 一 组 特定 的 云 应 用 。 由 于 负载 均 衔 顺 基 于 分 组 的 目的 端口 号 
(第 4 层 ) 以 及 目的 IP 地 址 做 决策 ， 因 此 它们 常 被 称 为 “第 4 层 交换 机 "。 一 旦 接收 到 一 
个 对 于 特定 应 用 程序 的 请 求 ， 负 载 均衡 器 将 该 请 求 分 发 到 处 理 该 应 用 的 某 一 台 主 机 上 (该 
主机 可 能 再 调用 其 他 主机 的 服务 来 协助 处 理 该 请 求 ) 。 当 主机 处 理 完 该 请 求 后 ， 回 负载 均 
衡器 回 送 响 应 ， 再 由 负载 均衡 需 将 其 中 继 发 回 给 外 部 客户 。 负 载 均衡 硕 不 仅 平 衡 主 机 间 的 
工作 负载 ， 而 且 还 提供 类 似 NAT 的 功能 ， 将 外 部 IP 地 址 转换 为 内 部 适当 主机 的 IP 地 址 ， 
然后 将 反方 向 流 回 客户 的 分 组 按照 相反 的 转换 进行 处 理 。 这 防止 客户 和 直接 接触 主机 ， 从 而 
具有 隐藏 网 络 内 部 结构 和 防止 客户 直接 与 主机 交互 等 安全 性 益处 . 


5. 6.2 等 级 体系 结构 


对 于 仅 有 数 千 台 主机 的 小 型 数据 中 心 ， 一 个 简单 的 网 络 也 许 就 足够 了 。 这 种 简单 网 络 由 
一 台 边界 路 由 器 、 一 台 负 和 载 均衡 器 和 几 十 个 机 架 组 成 ， 这 些 机 架 由 单一 以 太 网 交换 机 进行 互 
联 。 但 是 当主 机 规模 扩展 到 几 万 至 儿 十 万 的 时 候 ， 数 据 中 心 通常 应 用 路 由 器 和 交换 机 等 级 结 
构 (hierarchy of router and switch) , 图 5-30 显示 了 了 这样 的 拓扑 。 在 AGREE RIAD Tiling, i AL 
Be HH te tke A aE (在 图 5-30 中 仅仅 显示 了 两 台 ， 但 是 能 够 有 更 多 )。 在 每 台 接 人 路 





Hat Pil, 473 层 交换 机 。 每 台 接 和 路 由 融 与 一 台 顶 层 交 换 机 相连 ， 每 台 项 层 交 换 机 与 多 人 台 
二 层 交 换 机 以 及 一 台 负 载 均衡 硕 相 连 。 每 台 二 层 交 换 机 又 通过 机 架 的 TOR 交换 机 (第 三 层 
交换 机 ) 与 多 个 机 加 相连， 所 有 链 路 通 稼 使 用 以 太 网 作为 链 路 层 和 物理 层 协 以 ， 并 混合 使 用 
铀 缆 和 光缆 .通过 这 种 等 级 式 设 计 ， 可 以 将 数据 中 心 扩 展 到 几 十 万 台 主 机 的 规模 

财 为 云 详 用 提供 商 持 续 地 提供 启 可 用 性 的 应 用 是 至 天 重要 的 ， 所 以 数据 中 心 在 它们 的 
设计 中 也 包含 了 元 余 网 络 设备 和 元 余 链 路 (在 图 5-30 中 没有 显示 出 来 )， 例如， 每 全 TOR 
交换 机 能 够 与 两 台 二 层 交 换 机 相连 ， 每 台 接 入 路 由 大 、 一 层 交 换 机 和 二 层 交 换 机 可 以 优 余 
并 集成 到 设计 中 [Cisco 2012; Greenberg 2009b |. 在 图 5-30 中 的 等 级 设计 可 以 看 到 ， 每 台 
接 入 路 由 器 下 的 这 些 主机 构成 了 单一 子 网 。 为 了 使 ARP 广播 流量 本 地 化 ， 这 些 子 网 的 每 
个 部 被 进一步 划分 为 更 小 的 VLAN 子 网 ， 每 个 由 数 百 台 主 机 组 成 | Greenberg 2009a | 

尽管 刚才 描述 的 传统 的 等 级 体系 结构 解决 了 扩展 性 问题 ， 但 是 依然 存在 主机 到 主机 容 
量 受 限 的 问题 | Greenberg 2009b | 为 了 理解 这 种 限制 ， 午 新 考虑 图 5-30， 于 有 旦 假设 每 从 
主机 用 1Gbps 链 路 连接 到 它 的 TOR 交换 机 ， 而 交换 机 间 的 链 路 是 10Gbps 的 以 太 网 链 路 - 
在 相同 机 架 中 的 两 台 主 机 总 是 能 够 以 1Gbps 全 速 通信 ， 而 只 受 限 于 主机 网 络 接口 卡 的 速 
率 ， 然 而 ， 如 果 在 数据 中 心 网 络 中 同时 存在 多 条 并 发 流 ， 则 不同 机 架 上 的 两 台 主 机 间 的 最 
大 速率 会 小 得 多 .， 为 了 深入 理解 这 个 问题 ， 考 虑 不 同 机 加 上 的 40 对 不 同 主机 间 的 40 条 并 
发 流 的 情况 。 有 具体 来 说 ， 假设 图 5-30 ALAR 1 上 10 台 主 机 都 问 机 架 S 上 对 应 的 主机 发 送 
一 条 流 。 类似 地 ， 在 机 架 2 和 机 架 6 的 主机 对 上 有 10 RIP AI, LIE 3 和 机 加 7 lu] 47 10 
条 并 发 流 ， 机 架 4 和 机 加 8 间 也 有 10 条 并 发 流 。 如 果 每 一 条 流 和 共 他 流 经 同一 条 链 路 的 
流 平均 地 共享 链 路 容量 、 则 经 过 10Gbps 的 A 到 B BERR (LK 10Gbps AY B 2) C BE) 的 
40 条 流 中 每 条 流 获 得 的 速率 为 10Gbps/40 came 显著 小 于 1Gbps 的 网 络 接口 卡 速率 
如 果 主 机 加 的 流量 再 要 穿 过 该 等 级 纺 构 的 更 高 层 个 问题 会 变 得 更 加 严重 .对 这 个 限制 
Was as ae a we 但 是 这 会 大 大 增加 数据 中 心 的 
费用 ， 因 为 具有 高 接口 速率 的 交换 机 和 路 由 亚 是 非常 昂 贯 的 : 

因为 数据 中 心 的 一 个 关键 需求 是 放置 计算 和 服务 的 灵活 性 ， 所 以 支持 主机 到 主机 的 高 
带宽 通信 十 分 重要 | Greenberg 200b; Farrington 2010]. 例如， 一 个 大 规模 的 因特网 搜索 
引擎 可 能 运行 在 跨越 多 个 机 架 的 上 千 台 主机 上 ， 在 所 有 主机 对 之 间 有 具有 极 高 的 带宽 要 求 
类 似 地 ， 像 EC2 3 入 望 将 构成 用 户 服 务 的 多 台 虚 拟 机 运行 在 具有 最 大 

容量 的 物理 主机 上 ， 而 无 需 考 虑 它们 在 数据 中 心 的 位 置 。 如 果 这 些 物理 主机 跨越 了 多 个 机 
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5.6.3 数据 中 心 网 络 的 发 展 趋势 


为 了 降低 数据 中 心 的 费用 ， 同 时 提高 其 在 时 延 和 各 吐 量 上 的 性 能 ， 因 特 网 云 服 务 巨 头 
如 谷歌 、 脸 谱 、 亚 马 逊 和 微软 都 在 不 断 地 部 署 新 的 数据 中 心 网 络 设计 方案 .尽管 这 些 变 计 
方案 都 是 专 有 的 ， 但 是 许多 重要 的 超 势 是 一 样 的 。 

其 中 的 一 个 趋势 是 部 车 能 够 克服 传统 等 级 设计 缺陷 的 新 型 互联 体系 结构 和 了 网络 协 议 ， 
一 种 方法 是 采用 全 连接 拓扑 (fully connected topology) 来 符 代 交换 机 和 路 用 带 的 等 级 结构 
[| Al- Fares 2008; Greenberg 2009b; Guo 2009], KI 5-31 中 显示 了 这 种 拓扑 。 在 这 种 设计 
中 ， 每 台 第 一 层 交 换 机 都 与 所 有 第 二 层 交 换 机 相连 、 因 此 : 山 主机 到 主机 的 流量 绝 不 会 超 
过 该 交换 机 层次 ;， 尺 对 于 nn 台 第 一 层 交 换 机 ， 在 任意 两 台 二 层 交 换 机 间 有 n 条 不 相交 的 路 
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fe. APPEL Ye ee EULI EL FEE H TRAZA, eT IR 40 条 流 的 
例子 . 图 $-31 "Pay ded bee we Lh ae AP iat ek, ALA fea La IE CTRL AS 2 FR IE SM 
机 间 存 在 4 条 不 相交 的 路 径 、 可 以 一 起 为 前 两 台 二 层 交 换 机 之 问 提 供 总 和 为 40Cbps AY AR 
台 容 量 . 这 种 设计 不 仅 减 轻 了 主机 到 主机 的 容量 限制 ， 同 时 创建 了 了 一 种 更 加 有 灵活 的 计算 和 
服务 环境 在 这 种 环境 中 ， 任 何 未 连接 到 同一 台 交 换 机 的 两 个 机 架 之 间 的 通信 在 逻辑 上 是 
等 价 的 ， 而 不 论 其 在 数据 中 心 的 位 前 如 何 ， 


天 
-一 一 二 wet a aie ><- -I => 
Zi) i) Be) 2 区 一 法] Zs) Zin) 区 | 2s) 党 | a 起 | es) TOR 交 换 机 
hw | 
=> = SS > >>> >> = ae RE 
| 2 8 4 & & F 8 


He} 5-31 VE KIY AH 24 Fh 


另外 一 个 主要 的 趋势 就 是 采用 基于 船 运 集 妆 箱 的 模块 化 数据 中 心 (Modular Data Center, 
MDC)[ You Tube 2009; Waldrop 2007]. 在 MDC 中 ,在 一 个 标准 的 12 米 船 运 集装箱 内 ， 
工厂 构建 一 个 “迷你 数据 中 心 ” 并 将 该 集装箱 运送 到 数据 中 心 的 位 置 ， 每 一 个 集装箱 都 有 
多 达 数 千 台 主机 ， 堆 放 在 数 十 台 机 架 上 ， 并 且 紧 密 地 排列 在 一 起 ， 在 数据 中 心 位 置 ， 多 个 
集装箱 彼此 互联 ， 同 时 也 和 因特网 连 fe. 一 日 预 制 的 集装箱 部 署 在 数据 中 心 ， 通常 难以 检 
修 . 因此 ， 每 一 个 集装箱 都 得 体 地 设计 为 性 能 下 降 : HPE (服务 大 和 交换 机 ) 随 着 时 间 
的 推移 出 现 故 障 时 ， 集 装 箱 继续 运行 但 是 性 能 下 降 ， 当 许多 组 件 出 现 故 障 并 且 性 能 已 经 
降 到 低 于 某 个 国 值 时 ， 整 个 集装箱 将 会 被 移 除 ， 并 用 新 的 来 奉 换 
创建 由 集装箱 构成 的 数据 中 心 提 出 了 新 的 联网 挑战 。 对 于 MDC， 有 两 种 类 此 的 网 络 ， 每 

一 个 集装箱 中 的 内 部 网 络 和 互联 每 个 集装箱 的 核心 网 络 | Guo 2009; Farrington 2010 ] ,在 每 
个 集装箱 内 部 ， 在 规模 上 升 到 数 千 台 主 机 的 时 候 ， 通 过 廉价 的 商用 吉 比 特 以 太 网 交换 机 创建 

全 连接 的 网 络 ( 如 前 面 所 描述 ) 是 可 行 的 。 然 布 ， 核 心 网 络 的 设计 仍然 是 一 个 带 有 挑战 性 的 
问题 ， 这 需要 能 互联 成 百 上 干 的 集装箱 ， 同时 能 够 为 典 地 工作 负载 提供 路 多 人 “集装箱 的 主机 到 
主机 间 的 高 带宽 。 | Farrington 2010] 中 提出 了 一 种 互联 集装箱 的 混合 电 / 光 交换 机 体系 结构 。 

当 采 用 高 度 互联 拓扑 的 时 候 ， 一 个 主 aad ie nee 之 加 的 路 由 选择 算法 . 

种 可 能 是 来 用 随机 路 由 选择 方式 | Greenberg 2009b |. 另 一 种 可 能 是 在 每 台 主 机 中 部 着 多 
块 网 络 接口 卡 [Guo 2009 | , Pa A a 用 交换 机 上 ， 并 且 人 允许 主 
机 自己 在 交换 机 间 智 能 地 为 流量 选 路 。 这 些 方案 的 变种 和 扩展 正 被 部 轿 在 当前 的 数据 中 心 
中 ， 在 数据 中 心 设计 中 很 可 能 会 出 现 更 多 的 创新 ; 有 兴趣 的 读者 可 以 去 阅读 许多 有 关 数 据 
中 心 网 络 设 计 的 论文 . 


5.7 回顾 : Web 页 面 请 求 的 历程 


既然 我 们 已 经 在 本 章 中 学 过 了 链 路 层 ， 并 且 在 前 面 几 章 中 学 过 了 网 络 层 将 层 和 应 
用 层 ， 那 么 我 们 沿 协 议 栈 向 下 的 旅程 就 完成 了 ! 在 本 书 的 一 开始 (1.1 w), 我 们 说 过 
“本 书 的 大 部 分 内 容 与 计算 机 网 络 协 议 有 关 ” ， 在 本 半 中 ， 我 们 无 疑 已 经 看 到 了 情况 的 确 如 


ir 
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此 ! 在 继续 学 习 本 书 第 二 部 分 中 时 下 关注 的 章节 之 前 ， 通 过 对 已 经 学 过 的 协议 做 一 个 综合 
的 、 全 面 的 展望 ,我们 希望 总 结 一 下 沿 协 议 栈 加 下 的 旅程 。 而 做 这 个 “全 面 的 ”展望 的 一 
种 方法 是 识别 许多 OFZ!) 协议 ， 这 些 协 以 涉及 满足 甚至 最 简单 的 请 求 : 下 载 一 个 Web 
页 面 。 图 5-32 图 示 了 我 们 的 场景 : 一 名 学 生 Bob 将 他 的 便携 机 与 学 校 的 以 太 网 交换 机 相 
j£, 下 载 一 个 Web 页 面 (比如 说 www. google. com 主页 )。， 如 我 们 所 和 规 ， 为 满足 这 个 看 起 
来 简单 的 请 求 ， 背 后 隐 减 了 许多 细节 。 本 曹 后面 的 Wireshark 实验 仔细 检查 了 包含 一 些 分 
组 的 蹊 迹 文件 ， 这 些 分 组 更 为 详细 地 涉及 类 似 的 场景 。 


= comcast.net 
学 校 网 络 DNS 服务 器 
68.80.2.0/24 


00: 16:D3:23:68:8A 
68.85.2.101 


on 


68.87.71.226 







; — a) 
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68.80.0.0/13 
00:22:6B:45:1F:1BEY L£ 
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谷歌 网 络 

ws 64.233.160.0/19 
www.google.com EE | tf 
Web§iit % 2 
64.233.169.105 


~ g 





图 5-32 Web 页 请 求 的 历程 : 网 络 环境 和 动作 


5.7.1 准备 : DHCP, UDP, IP 和 以 太 网 


我 们 假定 Bob 启动 他 的 便携 机 ， 然 后 将 其 用 一 根 以 太 网 电缆 连接 到 学 校 的 以 太 网 交换 
机 ， 交 换 机 又 与 学 校 的 路 由 器 相连 ， 如 图 5-32 所 示 。 学 校 的 这 台 路 由 器 与 一 个 ISP 连接 ， 
本 例 中 ISP 为 comcast. net, 在 本 例 中 ，comcast. net 为 学 校 提 人 了 DNS ARS: HLL, DNS 
He Ae SE FA HE Comcast 网 络 中 而 不 是 学 校 网 络 中 。 我 们 将 假设 DHCP ARF aie íT TE A a 
R, WR E LT OL ABE : 

当 Bob 首先 将 其 便携 机 与 网 络 连接 时 ， 没 有 IP 地址 他 就 不 能 做 任何 事情 (例如 下 载 
一 个 Web 网页) 。 所以，Bob 的 便携 机 所 采取 的 一 个 网 络 相 关 的 动作 是 运行 DHCP 协议 ， 
以 从 本 地 DHCP 服务 问 获 得 一 个 IP 地 址 以 及 其 他 信息 。 

1) Bob 便携 机 上 的 操作 系统 生成 一 个 DHCP 请 求 报 文 (4.4.2 节 )， 并 将 这 个 报 文 放 
和 具有 目的 地 端口 67 (DHCP 服务 器 ) AUG 68 (DHCP 客户 ) 的 UDP 报 文 段 (3. 3 
广 ) 该 UDP 报 文 段 则 被 放置 在 一 个 具有 广播 IP 目的 地 地 址 (255.255.255.255) 和 源 IP 
地 址 0.0.0.0 AY IP 数据 报 中 (4.4.1 97), IAA Bob 的 便携 机 还 不 有 具有 一 个 IP 地 址 。 

2) 包含 DHCP 请 求 报 文 的 IP 数据 报 则 被 放置 在 以 太 网 帧 中 (5.4.2 17). 该 以 太 网 
WEHA A AY MAC 地 址 FF: FF: FF: FF: FF: FF， 使 该 帆 将 广播 到 与 交换 机 连接 的 所 有 设备 
(如 果 有 顺利 的 话 也 包括 DHCP Wk 645); 该 帧 的 源 MAC 地 址 是 Bob 便携 机 的 MAC 地 址 
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00: 16: D3: 23: 68: 8A. 

3) 包含 DHCP 请 求 的 广播 以 太 网 帆 是 第 一 个 由 Bob FEE ALAC IK BVA R R AR LY HOT 
KCAL LEAL R eg EA, eS Pe H EASY H 

4) 路 由 器 在 它 的 县 有 MAC 地 址 00: 22: 6B: 45: IF 的 接口 接收 到 该 广播 以 太 网 帧 ， 访 
帧 中 包含 DHCP 请 求 ， 并且 从 该 以 太 网 帧 中 抽取 出 了 正 数 据 报 ， 该 数据 报 的 广播 卫 目 的 地 
址 指示 了 这 个 IP 数据 报应 当 由 在 该 结 点 的 高 层 协议 处 理 ， 因 此 该 数据 报 的 载荷 (一 个 
UDP 报 文 段 ) 被 分 解 (3.2 节 ) In) FGA UDP, DHCP 请 求 报 文 从 此 UDP 报 文 段 中 抽取 
出 来 。 此 时 DHCP 服务 各 有 了 DHCP 请 求 报 文 

5) 我 们 假设 运行 在 路 由 需 中 的 DHCP 服务 融 能 够 以 CIDR (4.4.2 13) 块 68. 85.2.0/24 
分 配 IP 地 址 ， 所 以 本 例 中 ， 在 学 校内 使 用 的 所 有 IP 地 址 都 在 Comcast 的 地 址 块 中 。 我 们 假 
设 DHCP 服务 器 分 配 地 址 68. 85. 2. 101 给 Bob 的 便携 机 。DHCP 服务 融 生 成 包含 这 个 IP 地 址 
以 及 DNS IRI ARAJ IP Hehi (68. 87.71. 226) . BRIA KER H FAY IP 地址 (68. 85.2.1) 和 
子 网 块 (68. 85.2.0/24) (等 价 为 “网 络 掩 码 ”) 的 一 个 DHCP ACK 报 文 (4.4.2 节 )。 该 
DHCP 报 文 被 放 入 一 个 UDP 报 文 段 中 ，UDP 报 文 有 段 被 放 入 一 个 IP 数据 报 中 ，IP 数据 报 再 
被 放 入 一 个 以 太 网 帧 中 。 这 个 以 太 网 帧 的 源 MAC 地 址 是 路 由 器 连 到 归属 网 络 时 接口 的 
MAC 地 址 (00:22:6B:45:1F:1B)， 目 的 MAC 地 址 是 Bob 便携 机 的 MAC 地 址 (00: 16: D3 
:23:08:8A) 。 

6) 包含 DHCP ACK 的 以 太 网 帧 由 路 由 需 发 送 给 交换 机 ， 因 为 交换 机 是 自学 习 的 
(5.4.3 节 )， 并 且 先 前 从 Bob 便携 机 收 到 (包含 DHCP 请 求 的 ) 以 太 网 帧 ， 所 以 该 交换 机 
知道 寻 址 到 00: 16: D3:23:68:8A 的 帧 仅 从 通 回 Bob 便携 机 的 输出 端口 转 友 

7) Bob 便携 机 接收 到 包含 DHCP ACK 的 以 太 网 帧 ， 从 该 以 太 网 帧 中 抽取 IP 数据 报 ， 
从 IP 数据 报 中 抽取 UDP 报 文 段 ， 从 UDP 报 文 段 抽取 DHCP ACK 报 文 .Bob 的 DHCP 客户 
则 记录 下 它 的 IP 地 址 和 它 的 DNS 服务 器 的 IP 地 址 。 它 还 在 其 IP 转发 表 中 安装 默认 网 关 
的 地 址 (4.1 节 )。Bob 便携 机 将 回 该 默认 网 关 发 送 目的 地 址 为 其 子 网 68. 85. 2.0/24 以 外 
的 所 有 数据 报 。 此 时 ，Bob 便携 机 已 经 初始 化 好 它 的 网 络 组 件 ， 并 准 符 开 始 处理 Web 网 页 
获取 。( 注意 到 在 第 4 草 中 给 出 的 4 个 步 又 中 仅 有 最 后 两 个 DHCP 步 缀 是 实际 必要 的 ,) 


5.7.2 仍 在 准备 : DNS 和 ARP 


当 Bob 将 www. google. com 的 URL 键入 其 Web 浏览 希 时 ， 他 开局 了 一 长 串 事 件 ， 这 将 
导致 谷歌 主页 最 终 显示 在 其 Web 浏览 器 上 Bob 的 Web 浏览 器 通过 生成 一 个 TCP 套 接 字 
(2.7 节 ) 开始 了 该 过 程 ， 套 接 字 用 于 加 www. google. com 发 送 HTTP 请 求 (2.2 市 ), AST 
生成 该 套 接 字 ，Bob 便携 机 将 需要 知道 www. google. com AY IP 地 址 。 我 们 在 2.5 节 中 学 过 ， 
使 用 DNS 协议 提供 这 种 名 字 到 IP 地 址 的 转换 服务 

8) Bob 便携 机 上 的 操作 系统 因此 生成 一 个 DNS 查询 报 文 (2.5.3 市 )， 将 字符 串 
www. google. com 放 入 DNS 报 文 的 问题 段 中 ”该 DNS 报 文 则 放置 在 一 个 有 具有 53 号 (DNS 服务 
器 ) 目的 端口 的 UDP 报 文 段 中 。 该 UDP 报 文 段 则 被 放 和 人 具有 IP 目的 地 址 68. 87. 71. 226 (在 
第 5 步 中 DHCP ACK 返回 的 DNS 服务 全 地址 ) 和 源 IP 地址 68. 85. 2. 101 的 TP 数据 报 中 

9) Bob 便携 机 则 将 包含 DNS 请 求 报 文 的 数据 报 放 人 一 个 以 太 网 帆 中 ， 该 帧 将 发 送 
(在 链 路 层 寻 址 ) 到 Bob 学 校 网 络 中 的 网 关 路 由 器 然而， 即使 Bob 便携 机 经 过 上 述 第 5 
步 中 的 DHCP ACK 报 文 知道 了 学 校 网 关 路 由 更 的 IP 地址 (68. 85.2.1) ， 但 仍 不 知道 该 网 
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FAA airy MAC 地 址 ， 为 了 获得 该 网 关 路 由 吾 的 MAC 地 址 ，Bob 便携 机 将 需要 使 用 ARP 
协议 (5.4.1 47). 

10) Bob 便携 机 生成 一 个 具有 有 目的 IP 地 址 68. 85.2. 1 ( he Hy) ARP 查询 报 文 ， 
将 该 ARP 报 文 放置 在 De 播 目 的 地 址 (FF: FF: FF: FF: FF: FF) 的 以 太 网 帧 中 ， 并 
回 交 换 机 发 送 该 以 太 网 帆 ， 交 换 机 将 该 帧 交付 给 所 有 连 ne, ALAE OR H ai 

11) 网 天 路 由 带 在 通 往 和 尝 校 网 络 的 接口 上 接收 到 包含 该 ARP 查询 报 文 的 帧 ， 发 现在 
ARP 报 文中 目标 IP 地 址 68. 85. 2. 1 匹配 其 接口 的 IP 地址， 网 关 路 由 带 因 此 准备 一 个 ARP 
回答 ， 指 示 它 的 MAC 地址 00: 22: 6B: 45: 1F: 1B 对 应 IP 地 址 68. 85.2.1. Lo ARP 回答 放 
在 一 个 以 太 网 帧 中 ， 其 目的 地 址 为 00: 16: D3: 23: 68:8A (Bob 便携 机 ) ， 并 回 交换 机 发 送 
该 帧 ， 册 由 交 换 机 将 帧 交付 给 Bob 便携 机 

12) Bob 便携 机 接收 包含 ARP 回答 报 文 的 帧 ， 并 从 ARP 回答 报 文 中 抽取 网 关 路 由 需 
的 MAC 地 址 (00: 22: 6B: 45: 1F: 1B). 

13) Bob FEA PLACE (aR!) 能 够 使 包含 DNS 查询 的 以 大 网 帧 寻 址 到 网 关 路 由 做 的 
MAC 地 址 . 注意 到 在 该 帆 中 的 IP 数据 报 县 有 ]P 目的 地 址 68. 87.71.226 (DNS IRI 48). 
而 该 帧 具有 目的 地 址 OO: 22:6B: 45: 1F: 1B (MRA a). Bob 便携 机 向 交换 机 发 送 该 帧 ， 
交换 机 将 该 帧 交付 给 网 关 路 由 硕 ， 


5.7.3 仍 在 准备 : 域内 路 由 选择 到 DNS 服务 器 


4) 网 关 路 由 器 接收 该 帧 并 抽取 包含 DNS 查询 的 IP 数据 报 ， 路 由 器 查找 该 数据 报 的 
目的 地 址 (68. 87.71.226)。. 于 根据 其 转发 表决 定 该 数据 报应 当 发 送 到 图 5-32 的 Comcast 
网 络 中 最 左边 的 路 由 各 。1IP 数据 报 放置 在 链 路 层 帧 中 ， 该 链 路 适合 将 学 校 路 由 需 连 接 到 最 
i Comcast 路 由 入， 计量 AA 这 条 链 路 发 送 ， 

) 在 Comcast 网 络 中 最 左边 的 路 由 涡 接 收 到 该 帧 ， 抽 取 IP 数据 报 ， 检 查 该 数据 报 的 
H ane (68. 87. 71.226). 并 根据 其 转发 表 确定 出 接口 ， 经 过 该 接口 朝 着 DNS IRI Arte 
发 数据 报 ， 而 转发 表 已 根据 Comcast 的 域内 协议 (如 RIP, OSPF 或 IS-IS, 4.6 节 ) URA 
特 网 的 域 间 协议 BGP 所 填写 ， 

16) RAEE DNS 查询 的 IP 数据 报到 达 了 DNS HRS. DNS 服务 从 抽取 出 DNS 查询 报 
文 ， 在 它 的 DNS 数据 库 中 查找 名 字 www. google. com (2.5 节 )， 找 到 包含 对 应 www. google. com 
的 IP 地 址 (64.233. 169.105) 的 DNS id. (假设 它 当 前 缓存 在 DNS 服务 器 中 .) 前 面 讲 
过 这 种 绥 存 数据 源 于 google. com 的 权威 DNS 服务 器 a 5.2 43). 该 DNS 服务 需 形 成 了 一 
个 包含 这 种 主机 名 到 中 地址 映射 的 DNS 回答 报 文 ， 将 该 DNS 回答 报 文 放 和 人 UDP 报 文 段 
中 ， 该 报 文 段 放 人 寻 址 到 Bob 便携 机 (68.85.2. 101) Ay IP 数据 报 中 . 该 数据 报 将 通过 
Comcast 网 络 反 回转 发 到 学 校 的 路 由 天 ， 并 从 这 里 经 过 以 太 网 交换 机 到 Bob 便携 机 ， 

17) Bob 便携 机 从 DNS 报 文 抽取 出 服务 融 www. google. com AY IP Hath. RA, EKE 
工作 后 ，Bob 便携 机 此 时 准备 接触 www. google. com IRI a ! 


5.7.4 Web 客户 -服务 器 交互 : TCP 和 HTTP 


18) 既然 Bob 但 携 机 及 www. google. com HY IP 地 址 ， 它 E HE We AEM TCP BES (2.7 
， 该 套 接 字 将 用 于 癌 www. google. com Aik HTTP GET 报 文 (2.2.3 W), “4 Bob 生成 
pare “It, TE Bob 便携 机 中 的 TCP 必须 首先 与 www. google. com 中 的 TCP 执行 三 次 握手 
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(3.5.6 1). Bob EAE ALIA A EER EA H hi 80 (针对 HTTP 的 ) AY TCP SYN 
报 文 段 ， 将 该 TCP 报 文 段 放 置 在 县 有 目的 IP 地 址 64. 233. 169. 105 (www. google. com) 的 IP 
数据 报 中 、 将 该 数据 报 放置 在 MAC 地 址 为 00:22:6B:45:1F:1B (网 关 路 由 器 ) 的 帧 中 ， 
并 和 癌 交 换 机 发 送 该 帧 

9) 在 学 校 网络 、Comeast 网 络 和 谷歌 网 络 中 的 路 由 天 副 大 www. google. com 转发 包含 
TCP SYN 的 数据 报 ， 使 用 每 台 路 由 硕 中 的 转发 表 ， 如 前 面 步骤 14 ~16 那样 。 前 面 讲 过 文 
配 分 组 经 Comeast 和 谷歌 网 络 之 间 域 间 链 路 转发 的 路 由 天 转发 表 项 ， 是 由 BGP 协议 决定 
的 (4.6.3 节 ) 

20) Hee, 包含 TCP SYN 的 数据 报到 达 www. googole. com。 从 数据 报 抽取 出 TCP SYN 
报 文 开 分 解 到 与 端口 80 FR ABYC Sede AP AK HTTP WRF ai A Bob 便携 机 之 间 
Hy TCP 连接 生成 一 个 连接 套 接 字 (2.7 19). -个 TCP SYNACK (3.5.6 W) 报 文 段 ， 
将 其 族 入 问 Bob 便携 机 寻 址 的 一 个 数据 报 中 ， 最 后 放 人 链 路 层 帧 中 ， 该 链 路 适合 将 
www. google. com 连接 到 其 第 一 跳 路由 侣 

21) 包含 TCP SYNACK 报 文 段 的 数据 报 通 过 谷歌 、Comecast 和 学校 网 络 ， 最 终 到 达 
Bob 使 携 机 的 以 太 网 卡 。 数 据 报 在 操作 系统 中 分 解 到 步 又 18 生成 的 TCP EIF, 从 而 进 
和 连接 状态 

22) {B Bob (PHIL EEIT, WE (最终 !) HER Ie] www. google. com Aik FT 
T, Bob 的 浏览 器 生成 包含 要 获取 的 URL 的 HTTP CET 报 文 (2.2.3 节 )。HTTP GET 报 文 
WG A Efe, HP GET 报 文成 为 一 个 TCP 报 文 段 的 载 集 。 该 TCP 报 文 段 放 置 进 一 个 数 
据 报 中 ， 并 交付 到 www. google. com， 如 前 面 步 骤 18 ~20 所 述 。 

23) {E www. google. com 的 HTTP 服务 如 从 TCP Ejk Titi HTTP GET 报 文 ， 生 成 一 
个 HTTP 响应 报 文 (2.2 47), 将 请 求 的 Web 页 内 容 放 入 HTTP 响应 体 中 ， 并 将 报 文 发 送 
it TCP a 

24) 包含 HTTP 回答 报 文 的 数据 报 通 过 谷歌 、Comeast 和 学 校 网 络 转发 ， 到 达 Bob 便 
HEAL. Bob 的 Web 浏览 器 程序 从 套 接 字 读 取 HTTP 响应 ， 从 HTTP 响应 体 中 抽取 Web 网 页 
AJ html, FAF (最 终 1) 显示 Web 网 页 ， 

上 [上面 的 场景 已 经 涉及 许多 网 络 基础 ! 如 果 你 已 经 理解 上 面 例子! dn 数 或 全 部 ， 则 
你 也 已 经 涵盖 了 许多 基础 知识 ， 因 为 前 面 已 经 学 过 1.1 节 ， 其 中 我 们 谈 "EBAREN 
内 容 与 计算 机 网 络 协议 有 关 ”， 并 且 你 也 许 想 知道 一 个 协议 实 ste Mg 上 述 例子 看 
起 来 是 尽 可 能 详尽 ， 我 们 已 经 忽略 了 一 些 可 能 的 附加 协议 ( 例如， 运行 在 学 校 KER H ath 
中 的 NAT， 到 学校 网 络 的 无 线 接 入 ， 接 入 学 校 网 络 或 对 报 文 段 或 数据 报 加 密 的 安全 协议 ， 
网 络 管理 协 以 ) ， 以 及 人 们 将 会 在 公共 因特网 中 遇 到 的 一 些 考虑 (Web 缓存 ，DNS 等 级 体 
R). 我 们 将 在 本 书 的 第 a a 内 容 。 

最 后 ， 我 们 注音 到 上 述 例子 是 一 个 综合 、 完 整 的 例子 ， 还 观察 了 本 书 第 一 部 分 所 学 习 
过 的 许多 协议 的 十 分 “县 体 的 细节 7”。 该 例子 更 多 地 关注 “怎样 做 ”而 不 是 “为 什么 做 ”。 
对 于 想 和 开交 视野 的 读者 来 说 ， 有 关 网 络 协 议 设 计 更 为 深思 熟 卡 的 一 般 观 点 可 参见 [Clark 
1988; RFC 5218 | 


5.8 小 结 
在 这 一 草 中 ， 我 们 全 究 了 链 路 层 ， 包 括 它 的 服务 、 支 撑 它 操作 的 原则 和 许多 重要 的 特 
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我 们 看 到 链 路 层 的 基本 服务 是 将 网 络 层 的 数据 报 从 一 个 结 点 (主机 、 交 换 机 、 路 由 
ar, WiFi 接 入 点 ) 移动 到 一 个 相 邻 的 结 点 。 我 们 看 到 ， 在 通过 链 路 问 相 邻 结 点 传输 之 前 ， 
所 有 链 路 层 协议 者 是 通过 将 网 络 层 数 据 报 封装 在 链 路 层 帧 中 来 操作 的 。 然 而， 除了 这 个 共 
同 的 成 帧 功能 之 外 ， 我 们 知道 了 不 同 的 链 路 层 协 议 提 供 截 然 不 同 的 链 路 接 人 、 交 付 和 传输 
服务 。 造 成 这 些 差 异 的 部 分 原因 是 链 路 层 协 议 必 须 工作 在 很 多 种 链 路 类 型 上， 一 个 简单 的 
上 对 点 链 路 具有 单个 发 送 方 和 接收 方 ， 并 通过 单一 “线路 ”通信 。 一 个 多 路 访问 链 路 在 许 
多 发 送 方 和 接收 方 之 间 共 至; 因此 ， 对 多 路 访问 信道 的 链 路 层 协 议 有 一 个 协调 链 路 接 人 的 
协议 〈 它 的 多 路 访问 协议 ) Æ MPLS 的 情况 下 . 连接 两 个 相 邻 结 点 〈 例 如 ,在 IP 意 义 上 
的 两 台 相 邻 的 下 路 由 着 ， 它 们 是 到 某 个 目的 地 的 下 一 跌 IP BR ae) 的 “ 链 路 ”， 其 本 身 
可 能 实际 上 就 是 一 个 网 络 。 从 菜 种 意义 来 说 ， 将 一 个 网 络 视 为 一 条 “ 链 路 ”的 想法 没有 什 
么 可 奇怪 的 。 例 如 ， 连 接 家 庭 调制 解 调 器 /计算 机 到 远 端 调制 解 调 器 /路 由 器 的 一 条 电话 链 
路 ， 实 际 上 是 一 条 罕 过 精密 而 复杂 的 电话 网 络 的 路 径 . 

在 链 路 层 通信 所 依据 的 原理 中 ， 我 们 研究 了 差错 检测 和 纠正 技术 、 多 路 访问 协议 、 链 
路 层 寻 址 、 虚 拟 化 《YLAN) 以 及 扩展 的 交换 局 或 网 和 数据 中 心 网 络 的 构造 方法 。 今 天 对 
链 路 层 的 许多 关注 在 于 这 些 交 换 网 络 。 在 差错 检测 /纠正 场景 中 ， 为 了 对 帧 通过 链 路 传输 
时 可 能 发 生 的 比特 翻转 进行 检测 并 在 某 些 情况 下 进行 纠正 ， 我 们 研究 了 在 帧 的 首部 增加 附 
加 比特 的 方法 。 我 们 讨论 了 简单 的 奇偶 校 验 和 检验 和 方案 ， 以 及 更 健壮 的 循环 元 余 检 测 。 
然后 我 们 转向 多 路 访问 协议 主题 。 我 们 确定 和 学 习 了 协调 访问 广播 信道 的 3 大 类 方法 : 信 
道 划 分 方法 (TDM 、FDM ) 、 随 机 接 入 方法 (ALOHA 协议 和 CSMA 协议 ) 和 轮流 方法 
( 轮 询 和 令 牌 传递 )。 我 们 学 习 了 电缆 接 入 网 ， 发 现 它 使 用 了 多 种 这 些 多 路 访问 方法 ”我 们 
看 到 让 多 个 结 点 共享 单个 广播 信道 的 结果 ， 是 需要 在 链 路 层 提供 结 点 地 址 。 我 们 知道 物理 
地 址 和 网 络 层 地 址 是 非常 不 同 的 ， 而 且 在 因特网 场景 中 ， 一 个 专门 的 协 以 (ARP， 即 地 址 
解析 协议 ) 用 于 在 这 两 种 寻 址 形式 之 间 进 行 转换 ， 并且 详细 学 习 了 极为 成 功 的 以 太 网 协 
议 。 然 后 我 们 研究 了 共享 一 个 广播 信道 的 结 点 是 怎样 形成 一 个 局 域 网 的 ， 以 及 多 个 局 域 网 
怎样 能 够 互联 形成 一 个 更 大 的 局 域 网 ， 即 互联 这 些 本 地 结 点 完全 不 需要 网 络 层 路 由 选择 的 
干预 。 我 们 也 知道 了 多 个 虚拟 局 域 网 是 怎样 能 够 产生 一 个 单一 的 物理 局 域 网 体系 结构 的 ， 

通过 关注 当 MPLS 网 络 互联 IP 路 由 带 时 是 如 何 提 供 链 路 层 服务 的 和 展望 今天 用 于 大 型 
数据 中 心 的 网 络 设 计 ， 我 们 结束 了 链 路 层 的 学 习 。 通 过 识别 在 获取 一 个 简单 的 Web 网 页 
时 所 需要 的 许多 协 以 ， 我 们 完成 了 本 曹 〈 实 际 上 是 前 $ OE). EY SHER, AT 
协议 栈 向 下 的 旅程 现在 结束 了 ! 当然， 物理 层 位 于 数据 链 路 层 之 下 ,但 是 物理 层 的 细节 也 
许 最 好 留 给 男 外 一 门 课程 (例如 ， 在 通信 理论 而 不 是 计算 机 网 络 课程 中 ) 去 学 习 。 然而 我 
们 在 本 间 和 第 1 ae (在 1.2 节 中 讨论 了 物理 媒体 ) 中 已 经 接触 了 物理 层 的 几 个 方面 。 当 我 
们 在 下 一 草 中 学 习 无 线 链 路 特性 时 ， 将 再 次 考虑 物理 层 . 

尽管 我 们 治 协 议 栈 回 下 的 旅程 已 结束 ， 但 我 们 计算 机 网 络 的 学 习 仍 然 没 有 结束 。 在 后 
面 的 4 章 中 我 们 将 讨论 无 线 网 络 、 多 媒体 网 络 、 网 络 安全 和 网 络 管理 . 这 4 个 主题 不 便 放 
进 任何 一 层 中 ; 实际 上 每 个 主题 跨越 了 多 个 层次 。 因 此 理解 这 些 主题 (在 某 些 网 络 教 材 中 
被 列 为 高 级 主题 ) 需要 对 协议 栈 所 有 层次 都 有 坚实 的 基础 ， 我 们 对 链 路 层 的 学 习 已 经 完成 
了 这 样 的 基础 ! 
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5.1-5.2 # 

RI. 考虑 在 5.1.1 节 中 的 运输 类 比 ， 如果 一 个 乘客 类 比 为 一 个 数据 报 ， 什 么 类 比 于 链 路 层 帧 ? 

R2. 如 果 在 因特网 中 的 所 有 链 路 都 提供 可 靠 的 交付 服务 ，TCP 可 靠 传输 服务 将 是 多 余 的 吗 ” 为 什么 

R3. 链 路 层 协 议 能 够 问 网 络 层 提供 哪些 可 能 的 服务 ”在 这 些 链 路 层 服务 中 ， 哪 些 在 IP 中 有 对 应 的 服务 ? 
哪些 在 TCP 中 有 对 应 的 服务 ? 

5.3 节 

R4. ja 设 两 个 结 点 同时 经 一 个 速率 为 民 的 广播 信道 开始 传输 一 个 长 度 为 了 的 分 组 . 用 4d 
E 之 间 的 传播 时 延 。 如 果 di,,，< LR, SIRER? HA? 

RS. 765.3 Wp, 我们 列 出 了 广播 信道 的 4 种 希望 的 特性 。 这些 特 性 中 的 哪些 是 时 际 ALOHA 所 有 具有 的 ? 
令 牌 传递 具有 这 些 特 性 中 的 哪些 ? 

R6. 在 CSMA/CD 中 ， 在 第 5 次 碰撞 后 ， 结 点 选择 人 =4 的 概率 有 多 大 ? 结果 人 =4 在 10Mbps 以 太 网 上 对 
应 于 多 少 秒 的 时 延 ? 

R7. 使 用 人 类 在 鸡尾酒 会 交互 的 类 比 来 撒 述 轮 询 和 令 牌 传递 协议 。 

R8. 如 果 局 域 网 有 很 大 的 周 长 时 ， 为 什么 令 牌 环 协 以 将 是 低 效 的 ” 

5.4 节 

R9. MAC 地 址 空间 有 多 大 ?IPv4 的 地 址 空间 呢 ? LIPv 的 地 址 空间 呢 ? 

R10. 假设 结 点 A、B 和 C (通过 它们 的 适 配 需 ) 者 连接 到 同一 个 广播 局 域 网 上 。 如 果 A 向 B 发 送 数 干 个 
IP 数据 报 . 每 个 封装 帧 都 有 B 的 MAC Hihi, C 的 适 配 融 会 处 理 这 些 帧 吗 ?” 如 果 会 ，C 的 适 配 帮 将 

会 把 这 些 帧 中 的 IP 数据 报 传递 给 C 的 网 络 层 吗 ”如 果 A 用 MAC 广播 地 址 来 发 送 这 些 帧 ， 你 的 回答 

将 有 怎样 的 变化 呢 ? 

Ril. ARP 查询 为 什么 要 在 广播 帧 中 发 送 呢 7 ARP 啊 应 为 什么 要 在 一 个 具有 特定 目的 MAC 地 址 的 帧 中 发 送 呢 ? 

R12. 对 于 图 5-19 中 的 网 络 ， 路 由 器 有 了 两 个 ARP 模块 ， 每 个 部 有 自己 的 ARP K 同样 的 MAC 地址 可 能 
在 两 张 表 中 都 出 现 吗 ? 

R13. 比较 10BASE-T、100BASE-T 和 吉 比 特 以 太 网 的 帧 结构 。 它们 有 什么 不 同 吗 ? 

R14. 考虑 图 5-15。 在 4.4 节 的 寻 址 意义 下 ， 有 多 少 个 子 网 呢 ? 

R15. 在 一 个 支持 802. 1Q 协议 交换 机 上 能 够 配置 的 VLAN 的 最 大 数量 是 多 少 ? 

R16. 假设 支持 大 个 VLAN 组 的 N 台 交 换 机 经 过 一 个 干线 协议 连接 起 来 连接 这 些 交 换 机 需要 多 少 端口 ? 
评价 你 的 答案 ， 


假设 某 分 组 的 信息 内 容 是 比特 模式 1110 0110 1001 1101 ,并且 使 用 了 倘 校 验方 案 。 在 采用 二 维 奇 偶 校 

验方 SNAP. E E EFRR oe 么 ”你 的 回答 应 该 使 用 最 小 长 度 检 验 和 字段 .: 

P2. 说 明 ( 举 一 个 不 同 于 图 5 中 那个 的 例子 ) 二 维 奇 倘 校 验 能 够 纠正 和 检测 单 比特 差错 。 说 明 ( 举 一 
个 例子 ) 某 些 双 比 特 差错 能 够 被 检测 但 不 能 纠正 

P3. 假设 某 分 组 的 信息 部 分 (图 5-3 中 的 D) 包含 10 字 节 ， 它 由 字符 串 “Networking” 的 8 比特 无 符号 二 
进 制 ASCI 表示 组 成 。 对 该 数据 计算 因特网 检验 和 。 

P4. 考虑 前 一 个 习题 ， 但 此 时 假设 这 10 字 节 包含 
a. 数字 1 到 10 的 二 进 制 表示 。 


表示 这 两 个 结 
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b. 字母 B 到 KK (KĘ) 的 ASCH 表示 。 
ce. hE b Fk (小 写 ) 的 ASCI 表示 。 
计算 这 些 数据 的 因特网 检验 和 . 


. SIRS 比特 生成 多 项 式 ，C =10011， 并 且 假 设 D 的 值 为 1010101010。R 的 值 是 什么 ? 
.考虑 上 一 个 习题 ， 这 时 假设 D 具有 值 : 


a. 1001010101 
b. 0101101010 
c. 1010100000 ， 


. 在 这 道 习题 中 ， 我 们 探讨 CRC 的 某 些 性 质 。 对 于 在 5.2.3 节 中 给 出 的 生成 多 项 式 C( = 1001), ， 回 答 


下 列 问题 : 

a 为 什么 它 能 够 检测 数据 D 中 的 任何 单 比 特 差 错 ? 

b. 上 述 G 能 够 检测 任何 奇数 比特 差错 鸣 ” 为 什么 ? 

在 5.3 节 中 ,我 们 提供 了 时 际 ALOHA 效率 推导 的 概要 .在 本 习题 中 ， 我 们 将 完成 这 个 推导 。 

a. MYEL, CYAN 个 活跃 结 点 时 ， 时 辽 ALOHA 的 效率 是 Np(1 - p)'”。 求 出 使 这 个 表达 式 最 大 
化 的 p 值 

b. 使 用 在 (a) 中 求 出 的 p 值 ， 令 六 接近 于 无 穷 ， 求 出 时 际 ALOHA 的 效率 。( 提示 : 当 接近 于 无 
St, (1 - 1AN) "接近 于 1/e.) 


PO. 说 明 纯 ALOHA 的 最 大 效率 是 1A4(2e)。 注意 : 如 果 你 完成 了 上 面 的 习题 ， 本 习题 就 很 简单 了 

PIO. SIEM PA A 和 B， 它 们 都 使 用 时 际 ALOHA 协议 来 竞争 一 个 信道 。 假定 结 点 A 比 结 点 BAES 
的 数据 要 传输 ， 并 且 结 点 A 的 重 传 概率 p、 比 结 点 B 的 重 传 概率 ps 要 大 . 

a 给 出 结 点 A 的 平均 否 吐 量 的 公式 。 上 有 具有 这 两 个 结 点 的 协议 的 总 体 效率 是 多 少 ? 

b. UN p, =2p,, ZES A WOR APOE EZ BY EARNS? AA? WATE, MRE ETE fT 
么 样 的 p、 和 py 使 得 其 成 立 ? 

,一般 而 言 ， 假 设 有 NN 个 结 点 ， 其 中 的 结 点 A 具有 重 传 概率 2p 并 且 所 有 其 他 结 总 具有 重 传 概率 
给 出 表达 式 来 计算 结 点 A 和 其 他 任何 结 点 的 平均 吞吐 量 。 

Pll. 假定 4 个 活跃 结 点 A、B、C AID 都 使 用 时 际 ALOHA 来 竞争 访问 某 信道 。 假 设 每 个 结 点 有 无 限 个 分 
组 要 发 送 。 每 个 结 点 在 每 个 时 际 中 以 概率 p 尝试 传输 。 第 一 个 时 际 编 号 为 时 际 1， 第 二 个 时 际 编号 
为 时 际 2， 等 等 。 

a. 结 点 A 在 时 际 5 中 首先 成 功 的 概率 是 多 少 ? 

b EDN CAL B, CHD) 在 时 院 4 中 成 功 的 概率 是 多 少 ? 
ce FEI BR 3 中 出 现 首 个 成 功 的 概率 是 多 少 ? 

d 这 个 4 结 点 系统 的 效率 是 多 少 ? 

P12. SNM ROE. HL p eR CASE BE ALOHA 和 纯 ALOHA 的 效率 。 
a. Nats, 

h. N =25. 
c. N=35, 

P13. 考虑 具有 N 个 结 点 和 传输 速率 为 R bps 的 一 个 广播 信道 。 假 设 该 广播 信道 使 用 轮 询 进行 多 路 访问 
(有 一 个 附加 的 轮 询 结 点 )。 假设 从 某 结 点 完成 传输 到 后 续 结 点 允许 传输 之 间 的 时 间 量 ( 即 轮 询 时 
WE) 是 di 。 假 设 在 一 个 轮 询 周 期 中 ， 一 个 给 定 的 结 点 允许 至 多 传输 0 比特 。 该 广播 信道 的 最 大 雁 
吐 量 是 多 少 ? 

P14. 如 图 S-33 所 砂 ， 考 虑 通过 两 台 路 由 需 互 联 的 3 个 局 域 网 。 


a 对 所 有 的 接口 分 配 JP 地 址 。 对 子 网 1 使 用 形式 为 192. 168. 1. xxx 的 地 址 ， 对 子 网 2 使 用 形式 为 
192. 168. 2. xxx 的 地 址 、 对 子 网 3 使 用 形式 为 192. 168. 3. xxx 的 地 址 。 
b. 为 所 有 的 适 配 融 分 配 MAC 地 址 . 


GEE: GIB. FEAL fo £728 A 337 


P16. 


rly. 


P18. 


PIS; 


P20. 


. 考虑 图 5-33。 现 在 我 们 用 一 台 交 换 机 代替 子 


co 考虑 从 主机 下 向 主机 B 发 送 一 个 IP 数 据 报 。 假 设 所 有 的 ARP 表 都 是 最 新 的 。 就 像 在 5.4. 1 节 中 
对 单 路 由 器 例子 所 做 的 那样 ， 列 举 出 所 有 步骤 。 
d 重复 (e) ， 现 在 假设 在 发 送 主机 中 的 ARP 表 为 空 (并 且 其 他 表 都 是 最 新 的 ) 。 


网 1 和 子 网 2 之 间 的 路 由 禹 ， 并 且 将 子 网 2 

和 子 网 3 之 间 的 路 由 融 标 记 为 R1， 

. 考虑 从 主机 EE 向 主机 F 发 送 一 个 让 数据 A 
ik- 主机 正 将 请 求 路 由 需 RI 帮助 转发 该 | ay 


亿 


数据 报 吗 ? 为什么? 在 包含 IP 数据 报 的 以 。 人 时 yw 
太 网 帧 中 ， 源 和 目的 中 和 MAC 地 址 分 别 ” cB。 | 
是 什么 ? | 

. 假定 下 希望 向 B 发 送 一 个 中 数据 报 , 假设 S 
E 的 ARP EPRE BAJ MAC Hihi. E 
将 执行 ARP 查询 来 发 现 B 的 MAC 地 址 吗 ? 
为 什么 ?在 交付 给 路 由 器 RI 的 以 太 网 帧 
(包含 发 回 B 的 下 数据 报 ) 中 ， 源 和 目的 
IP Al MAC 地 址 分 别 是 什么 ? 

c 假定 主机 A HH Ble] EAL B 发 送 一 个 IP BHR. A 的 ARP 缓存 不 包含 B 的 MAC 地 址 ，B 的 ARP & 
存 也 不 包含 A 的 MAC 地 址 。 进一步 假定 交换 机 SI 的 转发 表 仅 包含 主机 B 和 路 由 需 RI 的 表 项 。 因 
此 ，A 将 广播 一 个 ARP 请 求 报 文 。 一 旦 交换 机 SI 收 到 ARP 请 求 报 文 将 执行 什么 动作 ? 路 由 器 RI 
也 会 收 到 这 个 ARP 请 求 报 文 吗 ” 如 果 收 到 的 话 ，R1 将 向 子 网 3 转发 该 报 文 吗 ?一 旦 主机 B 收 到 这 
个 ARP 请 求 报 文 ， 它 将 向 主机 A 回 发 一 个 ARP 响应 报 文 。 但 是 它 将 发 送 一 个 ARP 查询 报 文 来 请 求 
A 的 MAC 地 址 吗 ? 为 什么 ? 一旦 交换 机 Sl 收 到 来 目 主 机 B 的 一 个 ARP 响应 报 文 ， 它 将 做 什么 ? 

基 虑 前 面 的 习题 ， 但 是 现在 假设 用 一 台 交 换 机 代替 子 网 2 和 子 网 3 之 间 的 路 由 器 ， 在 这 种 新 的 场景 

中 回答 前 面 习题 中 的 问题 (a) ~ e)a 

前 面 讲 过 ， 使 用 CSMA/CD 协议 ， 适 配 需 在 碰撞 之 后 等 待人 K. 512 比特 时 间 ， 其 中 天 是 随机 选取 的 。 

对 于 大 =100， 对 于 一 个 10Mbps 的 广播 信道 ， 适 配器 返回 到 第 二 步 要 等 多 长 时 间 ? 对 于 100Mbps 的 

广播 信道 来 说 呢 ? 

假设 结 点 A 和 结 点 B 在 同一 个 10Mbps 广播 信道 上 ， 这 两 个 结 点 的 传播 时 延 为 325 比特 时 间 。 假 设 

对 这 个 广播 信道 使 用 CSMA/CD 和 以 太 网 分 组 ,假设 结 点 A 开始 传输 一 帧 ， 并 且 在 它 传 输 结 束 之 前 

结 点 B 开始 传输 一 帧 在 A 检测 到 B 已 经 传输 之 前 ，A 能 完成 传输 四 ?为 什么 ”如 果 回 答 是 可 以 ， 

则 A 错误 地 认为 它 的 帧 已 成 功 传输 而 无 碰撞 。 提 示 : 假设 在 1=0 比特 时 刻 ，A 开始 传输 一 帧 。 在 最 

坏 的 情况 下 ，A 传输 一 个 512 +64 比特 时 间 的 最 小 长 度 的 帧 .因此 A 将 在 上 =512 +64 比特 时 刻 完成 

帧 的 传输 。 如 果 B 的 信号 在 比特 时 间 上 =512 +64 比特 之 前 到 达 A、 则 答案 是 否定 的 。 在 最 坏 的 情况 

下 ，B 的 信和 号 什么 时 候 到 达 A? 

假设 结 点 A 和 结 点 B 在 相同 的 10Mbps 广播 信道 上 ， 并且 这 两 个 结 点 的 传播 时 延 为 245 比特 时 间 。 

假设 A AB 同时 发 送 以 太 网 巾 ， 帧 发 生 了 碰撞 ,然后 A 和 B 在 CSMA/CD 算法 中 选择 不 同 的 大 值 。 

假设 没有 其 他 结 点 处 于 活跃 状态 ,来自 A AB 的 重 传 会 碰撞 吗 ” 为 此 ， 完 成 下 面 的 例子 就 是 以 说 明 

问题 了 。 假设 A 和 B 在 1=0 比特 时 间 开 始 传输 。 它 们 在 1=245 比特 时 间 都 检测 到 了 碰撞 。 假 设 

K, =0 , K, = 1 。B 会 将 它 的 重 传 调整 到 什么 时 间 ?” A 在 什么 时 间 开 始 发 送 ? (注意 : 这 些 结 点 在 返 

回 第 2 步 之 后 ， 必 须 等 待 一 个 空闲 信道 ， 参 见 协 议 。) A 的 信和 号 在 什么 时 间 到 达 B 呢 ? B 在 它 预定 

的 时 刻 抑制 传输 吗 ? 

在 这 个 习题 中 ， 你 将 对 一 个 类 似 于 CSMA/CD 的 多 路 访问 协议 的 效率 进行 推导 。 在 这 个 协议 中 ， 时 

li] > AI, SEAL Aa Ac tt AB SY BR eA, SAT, AE BRE ALOHA 不 同 的 是 ， 一 个 时 际 的 长 度 


一 一 - 
— 
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P22: 


re, 


P27. 


(以 秒 计 ) 比 一 帧 的 时 间 CBI gi — OTA A TH) 小 得 多 . 令 $ Bea ARKE. Bae Pr yO AB 

有 恒定 长 度 上 =ARS， 其 中 尺 是 信道 的 传输 速率 , 上 是 一 个 大 整数 。 假定 有 AN 个 结 点 ， 每 个 结 点 者 有 

无 穷 多 帧 要 发 送 。 我 们 还 假设 do < 5 ， 以 便 所 有 结 点 在 一 个 时 际 时 间 结 束 之 前 能 够 检测 到 人 碰撞. 

这 个 协议 描述 如 下 : 

o 对 于 某 给 定 的 时 际 ， 如 果 没 有 结 点 占有 这 个 信道 ， 所 有 结 点 苑 争 该 信道 ; 特别 是 每 个 纺 点 以 概 
率 p 在 该 时 际 传 输 。 如 果 刚 好 有 一 个 结 点 在 该 时 际 中 传输 ， 该 结 点 在 后 续 的 上 -1 个 时 际 占 有 信 
道 ， 并 传输 它 的 整个 帧 

e 如 果 某 结 点 占用 了 信道 ,所 有 其 他 结 点 抑制 传输 ， 直 到 占有 信道 的 这 个 结 点 完成 了 该 帧 的 传输 
为 止 。 一 旦 该 结 点 传输 完 它 的 帧 ， 所 有 结 点 竞争 该 信道 。 

注意 到 此 信道 在 两 种 状态 之 间 交 替 :“ 生 产 性 状态 ”( 它 恰 好 持续 上 个 时 险 ) 和 “ 非 生 产 性 
状态 ”( 它 持续 随机 数 个 时 际 )。 显 然 ， 该 信道 的 效率 是 (kk+x)， 其 中 x 是 连续 的 非 生产 性 时 
HAJEE. 

a. 对 于 固定 的 入 和 pp， 确定 这 个 协议 的 效率 ， 

b. 对 于 固定 的 NN， 确 定 使 该 效率 最 大 化 的 p 值 

c. EHHE (b) 中 求 出 的 p CER N 的 负数 ) ， 确 定 当 AN 趋 回 无 穷 时 的 效率 。 
d 说 明 随 着 帧 长 度 变 大 ， 该 效率 趋 近 于 1. 


.现在 考虑 习题 P14 中 的 网 S$-33， 对 主机 A 、 两 台 路 由 需 和 主机 下 的 各 个 接口 提供 MAC 地 址 和 IP 地址. 


假定 主机 A 回 主 机 下 发送 一 个 数据 报 。 当 在 下 列 场合 传输 该 帧 时 ， 给 出 在 封装 该 IP 数据 报 的 帧 中 的 
源 和 目的 MAC 地 址 : (i) 从 A SUA WINRAR: Ci) MAR ae Aas Cii) MA 
AH AEM Bia BES BTA BES BRE HE TP AY) 下 数据 报 中 的 源 和 目的 下 地址。 

现在 假定 在 图 5-33 最 左边 的 路 由 器 被 一 台 交 换 机 替换 。 主 机 A、B、C 和 D AAI H dr LIE 
方式 与 这 台 交 换 机 相连 。 当 在 下 列 场 合 传输 该 帧 时 ， 给 出 在 封装 该 下 数据 报 的 帧 中 的 源 和 目的 
MAC 地 址 : (i) 从 A BA a; Gi) 从 左边 路 由 需 到 右边 的 路 由 各 ; (Cii) 从 右边 的 路 由 个 到 
F。 还 要 给 出 到 达 每 个 点 时 封装 在 该 帧 中 的 IP 数据 报 中 源 和 目的 IP 地 址 。 


. 考虑 图 5-15。 假定 所 有 和 链 路 都 是 100Mbps。 在 该 网 络 中 的 9 AELA EIRA Arl, REII 


最 大 总 聚合 耕 吐 量 是 多 少 ” 你 能 够 假设 任何 主机 或 服务 右 能 够 器 任何 其 他 主机 或 服务 如 发 送 分 组 
为 什么 ? 


. 假定 在 图 5-15 中 的 3 台 连 接 各 系 的 交换 机 用 集线器 来 代替 。 所 有 链 路 是 100Mbps。 现 在 回答 习题 


P23 中 提出 的 问题 。 
假定 在 图 5-15 中 的 所 有 交换 机 用 集 线 需 来 代替 。 所 有 链 路 是 100Mbps。 现 在 回答 在 习题 23 中 提出 
的 问题 . 


. 在 某 网 络 中 标识 为 A 到 下 的 6 个 结 点 以 星 形 与 一 台 交 换 机 连接 ， 考 虑 在 该 网 络 环境 中 茶 个 正在 学 习 


的 交换 机 的 运行 情况 。 假定 : (i) B 回 下 发 送 一 个 帧 ; (ii) E m B 回答 一 个 帧 ; Citi) A 向 B 发送 
一 个 帧 ; Civ) B 回 A 回 答 一 个 帧 。 该 交换 机 表 初 始 为 空 、 显 示 在 这 些 事件 的 前 后 该 交换 机 表 的 状 
态 。 对 于 每 个 事件 ， 指 出 在 其 上 面 转发 传输 的 帧 的 链 路 ， 并 简要 地 评价 你 的 答案 .。 

在 这 个 习题 中 ， 我 们 探讨 用 于 P 语音 应 用 的 小 分 组 。 小 分 组 长 度 的 一 个 主要 缺点 是 链 路 带宽 的 较 
大 比例 被 首部 字 节 所 消耗 。 基 于 此 ， 假 定 分 组 是 由 己 字 节 和 5 字 节 首部 组 成 。 

a 考虑 直接 发 送 一 个 数字 编码 语音 源 . 假定 该 源 以 128kbps 的 恒定 速率 进行 编码 。 假 设 每 个 源 向 网 
络 发 送 分 组 之 前 每 个 分 组 被 完全 填充 。 填充 一 个 分 组 所 各 的 时 间 是 分 组 化 时 延 ( packetization 
delay). WHE L， 确 定 分 组 化 时 延 (ÆR) 。 

. 大 于 20 毫秒 的 分 组 化 时 延 会 导致 一 个 明显 的 、 令 人 不 快 的 回音 - 对 于 上 = 1500 字 节 (大 致 对 应 
于 一 个 最 大 长 度 的 以 太 网 分 组 ) AL = 50 Z (对 应 于 一 个 ATM 信 元 ) ,确定 该 分 组 化 时 延 。 
c. Xf R =622Mbps 的 链 路 速率 以 及 了 = 1500 FHA L=50 字 节 ， 计 算 单 台 交 换 机 的 存储 转发 时 延 。 
d. 对 使 用 小 分 组 长 度 的 优点 进行 评述 ， 


_ 
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P28. 考虑 图 5-25 中 的 单个 交换 VLAN, {BRE — TT Ob te 2S Lg 1 相连 。 为 EE 和 CS 的 主机 和 
路 由 顺 接 口 分配 IP He. BRERA EE 主机 向 CS 主机 传送 一 个 数据 报时 网 络 层 和 链 路 层 所 采取 的 步 
又 (提示: 重读 课文 中 对 图 S-19 的 讨论 ) 。 
P29. 考虑 显示 在 图 5-29 中 的 MPLS 网 络 ， 假 定 路 由 融 RS 和 RO 现在 是 MPLS 使 能 的 。 假 定 我 们 要 执行 流 
量 工 程 ， 使 从 RO ATE A 的 分 组 要 经 R6-R4-R3-Rl1 交换 到 A， 从 RS 发 向 A 的 分 组 要 过 RS- R4- R2- 
RI 交换 。 给 出 RS 和 R6 中 的 MPLS 表 以 及 在 R4 中 修改 的 表 ， 使 得 这 些 成 为 可 能 。 
P30， 再 次 考虑 上 一 个 习题 中 相同 的 场景 ， 但 假定 从 R6 发 往 D 的 分 组 经 R6- R4-R3 交换 ， 而 从 RS AEE D 
的 分 组 经 R4-R2-RI-R3 交换 ， 说 明 为 使 这 些 成 为 可 能 在 所 有 路 巾 硕 中 的 MPLS 表 ， 
P31. 在 这 个 习题 中 ， 你 将 把 已 经 学 习 过 的 因特网 协议 的 许多 东西 拼装 在 一 起 。 假 设 你 走 进 房间 ， 与 以 太 
网 连接 ， 并 下 载 一 个 Web 页 面 。 从 打开 PC 电源 到 得 到 Web 网 页 ， 发 生 的 所 有 协议 步骤 是 什么 ” 假 
设 当 你 给 PC HIERT, E DNS RIERA PT Ahi. (提示 : 步骤 包括 使 用 以 太 网 、DHCP、 
ARP, DNS, TCP 和 HTTP fi.) 明确 指出 在 这 些 步骤 中 你 如 何 获得 网 关 路 由 埠 的 吓 和 MAC 地 址 。 
P32. 考虑 在 图 5-30 中 具有 等 级 拓扑 的 数据 中 心 网 络 。 假 设 现在 有 80 对流 ， 在 第 1 和 第 9 机 架 之 间 有 10 
个 流 ， 在 第 2 和 第 10 PLA Ziel Ay 10 个 流 ， 等 等 。 进 一 步 假 设 网 络 中 的 所 有 链 路 是 10Cbps， 而 主机 
和 TOR 交换 机 之 间 的 链 路 是 | Gbps 
a. 每 条 流 具 有 相同 的 数据 率 ; 确定 一 条 流 的 最 大 速率 . 
b. 对 于 相同 的 流量 模式 ， 对 于 图 5-31 中 高 度 互联 的 拓扑 ， 确 定 一 条 流 的 最 大 速率 ， 
c. 现在 假设 有 类 似 的 流量 模式 ， 但 在 每 个 机 架 上 涉及 20 台 主 机 和 160 对 流 。 确 定 对 这 两 个 拓扑 的 
最 大 流速 率 。 
P33. 考虑 图 5-30 中 所 示 的 等 级 网 络 ， 并 假设 该 数据 中 心 需要 在 其 他 应 用 程序 之 间 支 持 电子 邮件 和 视频 分 
发 。 假定 4 个 服务 右 机 架 预 留用 于 电子 邮件 ,4 个 服务 需 机 架 预 留用 于 视频 。 对 于 每 个 应 用 ， 所 有 
4 个 机 架 必 须 位 于 某 单一 二 层 交 换 机 之 下 ， 因 为 二 层 到 一 层 链 路 没有 充足 的 带宽 来 支持 应 用 内 部 的 
流量 。 对 于 电子 邮件 应 用 ， 假 定 99. 9% 时 间 仅 使 用 3 个 机 架 ， 并 且 视 频 应 用 具有 相同 的 使 用 模式 
a 电子 邮件 应 用 需要 使 用 第 4 个 机 架 的 时 间 比 例 有 多 大 ? 视频 应 用 需要 使 用 第 4 个 机 架 的 时 间 比 例 
有 多 大 ? 
b. 假设 电子 邮件 使 用 和 视频 使 用 是 独立 的 ， 这 两 个 应 用 需要 其 第 4 个 机 架 的 时 间 比 例 有 多 大 (等 价 
地 ， 概 率 有 多 大 )? 
e 假设 对 于 一 个 应 用 服务 天 短缺 的 时 间 具 为 0.001% 或 更 少 《〈 引 起 用 户 在 极 短 时 间 内 性 能 恶化 )， 
讨论 在 图 5-31 中 的 拓扑 能 够 怎样 使 用 ， 使 得 仅 7 个 机 架 被 共同 地 分 配给 两 个 应 用 (假设 拓扑 能 
够 支持 所 有 流量 )， 


i Wireshark 实验 

在 与 本 教科 书 配套 的 Web 站 点 (http://www. awl. com/kurose- rose) 上 ， 你 将 找到 一 个 Wireshark 实 
验 ， 该 实验 人 研究 了 IEEE 802. 3 协议 的 操作 和 以 太 网 帧 格式 。 第 二 个 Wireshark 实验 研究 了 在 家 庭 网 络 场 
景 下 所 获取 的 分 组 蹊 迹 。 
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土 学 位 .他 于 2007 年 当选 美国 国家 工程 院 院士. Simon S. Lam 
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© 为 什么 您 决定 专注 于 网 络 ? 

当 我 于 1969 年 秋季 作为 一 名 研究 生 新 生来 到 UCLA 时 ,我 原来 的 意图 是 研究 控制 论 。 后 来 我 参加 了 
Leonard Kleinrock 的 排队 论 课程 ， 他 给 我 留 下 了 深刻 印象 。 不 久 后 ,我 以 排队 系统 的 自 适 应 控制 作为 可 能 
的 论文 题目 进行 了 研究 。 在 1972 年 初 ，Larry Roberts jia y ARPAnet 卫星 系统 项 目 (后 来 称 为 分 组 卫 
Æ), Kleinrock 教授 请 我 参加 该 项 目 。 我们 做 的 第 一 件 事 是 为 时 辽 ALOHA 协议 引入 一 个 简单 而 实用 的 回 
退 算法 ,不 久 后 ， 我 发 现 了 许多 有 趣 的 研究 问题 ， 如 ALOHA 的 不 稳定 性 问题 和 对 自 适应 回 退 的 需求 ， 
这 些 形成 了 我 学 位 论文 的 核心 ， 

e 20 世纪 70 年 代 您 开始 了 在 UCLA 的 学 生生 涯 ， 活 贱 于 因特网 的 早期 阶段 。 那 时 的 情况 怎样 ” 那 

时 人 们 对 因特网 将 变 成 什么 样 有 哪些 大 致 想法 ? 

那 时 的 环境 与 我 曾 在 产业 界 和 学 术 界 所 见 到 的 其 他 系统 构建 项 目的 确 没 什么 不 同 。ARPAnet 初始 规定 
的 目标 是 相当 谦 慎 的 ， 艺 提供 从 远程 位 置 接 入 昂 贯 的 计算 机 的 手段 ， 使 许多 科学 家 能 够 使 用 这 些 计算 机 。 
然而 ， 随 着 分 组 卫星 项 目 于 1972 年 和 分 组 无 线 电 项 目 于 1973 年 启动 ，ARPA 的 目标 有 了 相当 大 的 扩展 . 到 了 
1973 年 ，ARPA 同时 建造 了 3 个 不 同 的 分 组 网 络 ， 对 Vint Cerf 和 Bob Kahn 来 说 研发 互联 策略 变 得 有 必要 了 

回顾 过 去 ， 所 有 这 些 网 络 方面 的 进步 和 进展 被 视 为 (我 相信 ) 符合 逻辑 的 而 不 是 虚 纪 的。 没有 人 能 
够 想象 到 今天 的 因特网 规模 和 个 人 计算 机 的 能 力 。 在 第 一 台 PC 出 现 之 前 有 十 多 年 时 间 。 那 时 为 了 正确 
地 做 处 理 ， 多 数学 生 以 一 系列 穿孔 卡片 的 形式 提交 他 们 的 计算 机 程序 以 进行 批 处 理 ， 仅 有 某 些 学 生 能 够 
直接 接触 计算 机 ， 而 计算 机 通常 位 于 一 个 受 限 的 区 域 中 。 调 制 解 调 融 速度 缓慢 旦 稀有 。 作 为 一 名 全 究 生 ， 
在 书 果 上 我 仅 有 一 部 电话 机 ， 使 用 铅笔 和 纸 从 事 我 的 大 部 分 工作 . 

e。 您 认为 网 络 和 因特网 领域 在 未 来 将 往 何 处 发 展 ? 

在 过 去 ， 因 特 网 足协 议 的 简单 性 是 它 在 竞争 上 取胜 的 最 大 法 宝 ， 并 且 成 为 网 络 互 联 事实 上 的 标准 . 
与 它 的 竞争 对 手 如 20 世纪 80 年 代 的 X. 25 和 20 世纪 90 年 代 的 ATM 不 同 , 足 能 够 在 任何 链 路 层 联网 技 
术 之 上 运行 ， 央 为 它 仅 提 供 尽 力 而 为 的 数据 报 服务 ， 因 此 ， 任 何 分 组 网 络 都 能 够 连接 到 因特网 上 。 

SR, VP 的 最 大 长 处 实际 上 成 为 了 一 种 缺点 。IP 目前 像 一 件 紧 身 衣 ， 限 制 了 因特网 回 特定 方 问 发 
展 。 近 年 来 ， 许 多 研究 人 员 仅 将 他 们 的 努力 重新 定向 到 应 用 层 上 。 在 无 线 自 组 织 网 络 、 传 感 网 络 和 卫星 
网 络 方面 也 做 了 大 量 研 究 工 作 。 这 些 网 络 能 够 看 作 独 立 的 系统 或 链 路 层 系 统 ， 因 为 位 于 JP 的 紧身 衣 之 
外 ， 所 以 它们 能 够 繁 采 发 展 。 

许多 人 对 于 P2P 系统 可 能 作为 新 奇 的 因特网 应 用 的 平台 而 感到 欢欣 鼓舞 ,然而 ，P2P 系统 在 使 用 因 
特 网 资源 方面 效率 很 低 。 我 关注 的 一 个 问题 是 ， 随 着 因特网 不 断 互联 各 种 设备 和 支持 未 来 的 P2P 使 能 的 
应 用 ， 因 特 网 核心 的 传输 和 交换 能 力 比 起 对 因特网 流量 的 需求 来 说 ， 前 者 是 否 将 更 快 地 不 断 增 加 ,没有 
大 量 的 容量 预 留 ， 在 面临 恶意 攻击 和 拥塞 时 ， 确 保 网 络 稳定 性 将 是 一 项 重要 的 任务 。 

因特网 的 急剧 增长 也 要 求 以 高 速率 为 全 世界 的 网 络 操作 者 和 企业 分 配 新 的 下 地 址 。 以 当前 速度 ， 未 
分 配 的 卫 地 址 池 将 在 几 年 内 消耗 列 尽 ， 当 该 事件 发 生 时 ， 仅 能 从 IPv6 地 址 空间 中 分 配 大 量 地 址 空间 的 相 
邻 块 了 。 因 为 IPv6 采用 的 启动 缓慢 ， 由 于 对 早期 用 户 缺 乏 激励 ， 所 以 IPv4 和 1Pv6 将 很 有 可 能 在 今后 的 
因特网 上 共存 很 多 年 。 从 IPv4 主宰 的 因特网 向 IPv6 主宰 的 因特网 迁移 将 需要 全 球 做 出 巨大 的 努力 。 

e 您 的 工作 最 具 挑 战 性 的 部 分 是 什么 ? 

我 的 工作 最 具 挑 战 性 的 部 分 是 ， 作 为 一 名 教授 传授 和 激发 我 课堂 上 的 每 个 学 生 以 及 我 所 指导 的 每 个 
博士 研究 生 ， 而 不 只 是 获得 重要 的 成 就 。 非 常 聪明 和 有 学 习 动 力 的 人 可 能 要 求 少 量 的 引导 而 非 许 多 其 他 
东西 。 我 经 常 从 学 生 那 里 学 到 很 多 东西 ， 比 他 们 从 我 这 里 学 到 的 多 .教育 和 激励 学 术 上 落后 的 学 生 是 一 
项 重要 的 挑战 。 

您 能 预见 到 技术 对 未 来 学 习 方 面 有 哪些 影响 ? 

最 终 几 乎 所 有 的 人 类 知识 将 可 以 通过 因特网 得 到 ， 因 特 网 将 成 为 最 为 强 有 力 的 学 习 工 具 。 这 种 巨大 
的 知识 库 将 具有 为 全 世界 的 学 生 们 提供 公平 竞争 环境 的 潜力 。 例 如 ， 任何 国家 的 有 上 进 心 的 学 生 将 能 够 
访问 最 好 课程 的 Web 站 点 、 多 媒体 演讲 和 教学 材料 。 据 说 IEEE 和 ACM 数字 图 书馆 已 经 加 速 了 中 国 的 计 
算 机 科学 研究 的 发 展 ， 与 此 同时 ， 因 特 网 将 超越 所 有 学 习 的 地 理 障 但 。 
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在 电话 技术 领域 ， 过 去 的 15 年 可 认为 是 蜂 壤 电话 技术 的 黄金 发 展期 ， 全 球 范 膨 的 移 
动 蜂 宽 电 话 用 户 数量 从 1993 年 的 3400 万 增长 到 2011 年 的 超过 55 亿 ， 同 时 蜂 夫 电话 用 户 
数量 现在 也 超过 了 固定 电话 用 户 数量 。 蜂 帘 电 话 的 许多 优点 是 显而易见 的 ， 遂 过 一 个 移动 
性 强 、 重 量 轻 的 设备 ， 能 在 任何 地 方 、 任 何 时 间 、 无 缝 地 接 入 全 球 电 话 网 络 。 随 者 便携 
机 、 掌 上 机 和 智能 手机 的 出 现 ， 以 及 它们 随时 、 随 地 、 无 颖 地 接 入 全 球 因 特 网 的 束 谤 的 实 
现 ， 无 线 央 特 网 设备 的 使 用 在 不 久 的 将 来 是 否 会 出 现 类 似 的 壮 肛 发 展 呢 ? 

不 管 无 线 因 特 网 设备 未 来 如 何 增长 ， 无 线 网 络 以 及 它们 提供 的 移动 相关 服务 显然 已 经 
展现 在 人 们 面前 了 。 从 网 络 的 观点 来 说 ， 由 这 些 网 络 引发 的 挑战 ， 特 别 是 在 数据 链 路 层 和 
网 络 层 ， 与 传统 的 有 线 网 络 的 差别 非常 大 ， 寡 要 用 单独 一 章 ( 即 本 章 ) 的 篇 幅 来 专门 讨论 
无 线 网 络 和 移动 网 络 . 

在 本 章 中 ， 我 们 首先 讨论 移动 用 户 、 无 线 链 路 和 网 络 ， 以 及 它们 与 所 连接 的 更 大 网 络 
(通常 是 有 线 网 络 ) 之 间 的 关系 。 我 们 将 指出 以 下 两 方面 的 差别 : 一 个 是 在 该 网 络 中 由 通 
信 链 路 的 无 线 特性 所 带 来 的 挑战 ， 男 一 个 是 由 这 些 无 线 链 路 使 能 的 移动 性 .在 无 线 和 移动 
性 之 间 进 行 区 分 非常 重要 ， 它 使 我 们 能 更 好 地 区 分 、 标 识 和 掌握 在 每 个 领域 中 的 重要 要 
念 。 值 得 注意 的 是 ， 实 际 上 在 许多 网 络 环境 中 ， 其 中 的 网 络 结 点 是 无 线 的 而 不 是 移动 的 
(例如 具有 固定 工作 站 和 大 显示 需 的 无 线 家 庭 或 办 公 网 络 ) ， 而 有 限 的 移动 性 也 并 不 要 求 用 
无 线 链 路 〈 例 如 ， 一 个 在 家 里 使 用 便携 机 的 员工 ， 关 闭 便携 机 ， 开 车 去 工作 ， 然 后 将 该 便 
携 机 连接 到 公司 的 有 线 网 络 上 )。 当 然 ， 许 多 最 让 人 激动 的 网 络 环境 是 那些 让 用 户 同 时 具 
有 无 线 和 移动 性 的 网 络 环境 。 例 如 在 下 列 情况 下 ， 一 个 移动 用 户 (不 妨 假设 其 正 坐 在 汽车 
后 座 上 ) 维持 一 个 IP 语音 呼叫 和 多 个 进行 中 的 TCP 连接 ， 同 时 又 以 每 小 时 160 公里 的 速 
度 飞 驰 在 高 速 公 路 上 。 正 是 在 这 种 无 线 和 移动 的 交集 中 ， 我 们 将 会 发 现 最 有 趣 的 技术 
挑战 : 

首先 我 们 将 说 明 用 于 考虑 无 线 通 信和 移动 性 的 环境 ， 该 环境 为 无 线 (并 可 能 是 移动 ) 
的 用 户 通过 位 于 网 络 边 缘 的 无 线 链 路 连接 进 更 大 的 网 络 基础 设施 中 的 网 络 。 然 后 在 6. 2 市 
中 ， 我 们 考虑 这 种 无 线 链 路 的 特性 ， 还 将 包括 一 个 对 码 分 多 址 接 人 (Code Division Multiple 
Access, CDMA) 的 简要 介绍 。CDMA 是 一 个 在 无 线 网 络 中 经 常 使 用 的 共享 媒体 接 人 协议 。 
在 6.3 节 中 ， 我 们 将 更 为 深入 地 分 析 IEEE 802.11 (WiFi) 无 线 LAN 标准 的 链 路 级 方面 ; 
同时 我 们 还 将 对 蓝牙 和 其 他 无 线 个 人 域 网 络 做 简要 描述 。 在 6.4 节 中 ， 我 们 概述 蜂窝 因 特 
网 接 入 ， 其 中 包括 3C 和 正在 兴起 的 4G 技术 ， 它 们 能 够 同时 提供 语音 和 高 速 因 特 网 接 入 。 
在 6.5 节 ， 我们 将 注意 力 转 癌 移动 性 ， 关 注 于 移动 用 户 的 定位 问题 、 对 移动 用 户 的 路 由 选 
择 以 及 “切换 ”( handing off) 移动 用 户 ( 即 在 网 络 中 从 一 个 接 入 点 动态 地 移动 到 男 一 点 
的 用 户 ) 等 问题 。 我 们 将 在 6.6 节 和 6.7 节 中 分 别 考察 在 移动 IP 标准 和 CSM 中 是 如 何 实 
现 这 些 移动 服务 的 。 最 后 ， 我 们 将 在 6. 8 节 中 考虑 无 线 链 路 和 移动 性 对 运输 层 协 议和 网 络 
应 用 程序 的 影响 。 
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6.1 概述 


公共 WIFI FEA: 路 灯 方 案 很 快 将 实现 吗 ? 

Wiki AE ( 即 用 户 能 够 找到 802. 11 无 线 接 入 的 公共 位 置 ) 在 全 世界 的 旅馆 、 机 场 
和 咖啡 屋 变 得 日 益 常 见 . 大 多 数 大 学 校园 提供 了 无 所 不 在 的 无 线 接 入 ， 找 一 个 不 提供 无 
线 因特网 接 入 的 旅馆 也 很 难 ， 

在 过 去 的 十 年 中 ， 一 些 城市 已 经 设计 、 部 署 和 运行 了 市 政 的 Wiki 网 络 。 作 为 公共 
服务 (非常 像 街 灯 ) 提供 无 所 不 在 的 WiFi 接 入 到 社区 的 前 景 引人入胜 ， 通 过 向 所 有 居 
民 提 供 因特网 接 入 ， 有 助 于 填 平 数字 鸿沟 ， 并 能 促进 经 济 发 展 ， 世界 上 的 许多 城市 ， 包 
括 费 城 、 香 港 、 明 尼 阿 波 利 斯 、 伦 敦 和 奥克兰 ， 已 经 计划 在 城市 中 提供 无 所 不 在 的 无 
线 ， 或 者 已 经 在 不 同 程度 上 做 到 了 这 一 点 。 美国 宾夕法尼亚 州 费城 的 目标 是 “将 费城 变 
为 国家 最 大 的 WiFi 热 区 ， 有 助 于 改善 教育 ， 填 平 数字 鸿沟 ， 增 强 邻 居 交 往 ， 以 及 减少 
KERA”. 这 项 雄心 勃勃 的 规划 依据 该 城市 、 无 线 费 城 (一 个 非 营 利 组 织 ) 和 因特网 
服务 提供 商 Earthlink 达成 的 一 项 协议 ， 这 将 在 履 盖 城市 80% 区 域 的 街道 路 灯 杆 和 交通 
控制 设备 上 建设 一 个 802. 11b 热 区 的 运行 网 络 。 而 由 该 网 络 产 生 的 金融 和 运行 股份 在 
2008 年 出 售 给 了 一 群 私 人 投资 者 ， 他 们 在 2010 年 再 将 该 网 络 回 售 给 该 城市 。 其 他 城市 
如 明 尼 阿 波 利 斯 、 多 伦 多 、 香 港 、 伦 敦 和 奥克兰 已 经 取得 了 较 小 规模 的 成 功 。 

运行 在 无 需 许 可 证 的 频谱 上 ( 因此 能 够 在 无 需 购买 昂贵 的 频谱 使 用 权 的 情况 下 部 署 ) 
的 802. 11 网 络 看 起 来 使 他 们 在 资金 上 具有 吸引 力 。 然 而 ，802. 11 HAH (参见 6.3 节 ) 
比 起 3G 蜂窝 基站 (参见 6.4 节 ) 来 缺少 大 量 的 频段 ， 要 求 部 署 大 量 的 端点 来 履 盖 相同 的 
地 理 区 域 。 在 另 一 方面 ， 提供 因 特 网 接 入 的 蜂 渍 数据 网 络 运 行 在 许可 证 频谱 上 。 蜂 鲍 提 供 
商 为 其 网 络 的 频谱 接 入 权 支 付 数 十 亿美 元 ， 使 得 蜂 寅 数据 网 络 是 商务 而 不 是 市 政事 务 。 


图 6-1 显示 了 我 们 将 要 讨论 无 线 数据 通信 和 移动 性 主题 的 环境 。 为 使 讨论 具有 一 般 性 
以 轿 盖 各 种 各 样 的 网 络 ， 将 包括 像 IEEE 802. 11 这 样 的 无 线 局 域 网 和 像 3G 网 络 这 样 的 蜂 
食 网 络 来 开始 我 们 的 讨论 ; 然后 在 后 续 各 节 中 ， 我 们 将 对 特定 的 无 线 体 系 结构 进行 更 加 详 
细 的 讨论 。 我们 在 无 线 网 络 中 能 够 指出 下 列 要 素 : 
© 无 线 主机 。 如 同 在 有 线 网 络 中 一 样 ， 主 机 是 运行 应 用 程序 的 端 系统 设备 。 无 线 主 
机 (wireless host) 可 以 是 便携 机 、 掌 上 机 、 智 能 手机 或 者 傈 面 计 算 机 。 主 机 本 号 
可 能 移动 ， 也 可 能 不 移动 。 
© 无 线 链 路 。 主 机 通过 无 线 通信 链 路 (wireless communication link) 连接 到 一 个 基站 
(定义 见 下 文 ) 或 者 另 一 台 无 线 主机 。 不 同 的 无 线 链 路 技术 具有 不 同 的 传输 速率 和 能 
够 传输 不 同 的 距离 。 图 6-2 显示 了 较为 流行 的 无 线 链 路 标准 的 两 种 主要 特性 (A m 
区 域 和 链 路 速率 )。( 该 图 仅 表示 了 提供 这 些 特性 的 大 至 概念 。 例 如， 这 些 类 型 中 的 
某 些 网 络 现 在 正在 部 署 ， 某 些 链 路 速率 取决 于 距离 、 信 道 条 件 和 在 无 线 网 络 中 的 用 
户 数量 ， 能 够 比 显 示 的 值 更 高 或 更 低 些 .) 我 们 将 在 本 章 的 前 半 部 分 讨论 这 些 标准 。 
在 6.2 节 中 ,我 们 也 考虑 其 他 无 线 链 路 特性 如 它们 的 比特 差错 率 及 其 原因 ). 
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图 6-2 部 分 无 线 网 络 标准 的 链 路 特性 


在 图 6-1 中 ， 无 线 链 路 将 位 于 网 络 边缘 的 主机 连接 到 更 大 的 网 络 基础 设施 中 。 我 们 要 


马上 补充 的 是 ， 无 线 链 路 有 时 间 梓 应 用 在 一 个 网 络 中 以 连接 路 由 天 、 交 换 机 和 其 他 网 络 设 
备 。 然 而 ， 在 本 和 草 中 我 们 关注 的 焦点 是 无 线 通 信 在 网 络 边缘 的 应 用 ， 因 为 许多 最 为 振奋 人 
心 的 技术 挑战 和 多 数 增长 就 发 生 在 这 里 。 


e 基站 。 基 站 (base station) 是 无 线 网 络 基础 设施 的 一 个 关键 部 分 。 与 无 线 主 机 和 
无 线 链 路 不 同 ， 基 站 在 有 线 网 络 中 没有 明确 的 对 应 设备 。 它 负责 回 与 之 关联 的 无 
线 主 机 发 送 数据 和 从 主机 那里 接收 数据 (例如 分 组 )。 基 站 通常 负责 协调 与 之 相关 
联 的 多 个 无 线 主 机 的 传输 。 当 我 们 说 一 人 台 无 线 主 机 与 某 基 站 “相关 联 ” 时 ， 则 是 
指 : (该 主机 位 于 该 基站 的 无 线 通 信和 窗 盖 范围 内 ; 人 该 主机 使 用 该 基站 中 继 它 
(该 主机 ) 和 更 大 网 络 之 间 的 数据 ， 蜂 需 网 络 中 的 蜂窝 塔 (cell tower) 和 802.11 
无 线 LAN 中 的 接 入 点 (access point) 都 是 基站 的 例子 - 
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在 图 6-1, Se ERARE KFR, ARER EER), ， 央 此 这 
种 连接 在 无 线 主机 和 与 之 通信 的 其 tse 4p 2 2 RRA :中 继 的 作用 . 

与 基站 关联 的 主机 通 笛 被 称 为 以 基础 设施 模式 (infrastructure mode) 运行 ， 因 为 所 有 传 
统 的 网 络 服务 ( 如 地 址 分 配 和 路 由 选择 ) 都 由 网 络 向 通过 基站 相连 的 主机 提供 ， 在 自 组 织 网 
络 (ad hoc network) 中 ， 无 线 主 机 没有 这 样 的 基础 设施 与 之 相连 。 在 没有 这 样 的 基础 设施 的 
情况 下 ， 主 机 本 身 必须 提供 诸如 路 由 选择 、 地 址 分 配 、 类 似 于 DNS 的 名 字 转 换 等 服务 


当 一 侣 移动 主机 移动 超出 一 个 基站 的 窄 盖 范 围 而 到 达 男 一 个 = 的 覆盖 范围 后 ， 它 将 
改变 其 接 入 到 更 大 网 络 的 连接 点 ( 即 改 变 与 之 相关 联 的 基站 ) ， -过 程 称 作 切 换 〈hand 


off) 。 这 种 移动 性 引发 了 许多 具有 挑战 性 的 问题 。 如 果 p i 那么 如 何 找到 
它 在 网 络 中 的 当前 位 置 ， 从 而 使 得 数据 可 以 回 该 移动 主机 转发 ”如 果 一 台 主 机 可 以 位 于 许 
a ee 的 一 个 ， 那 么 如 何 进 行 编 址 ? 如 果 主 机 在 一 个 TCP 连接 或 者 电话 呼叫 期 间 移 
， 数 据 如 何 路 由 选择 而 使 连接 保持 不 中 断 ?” 这 些 以 及 许多 (许多 !) 其 他 问题 使 得 无 线 
no al 个 让 人 振奋 的 网 络 人 研究 领域 . 
e 网 络 基 础 设施 ,这 是 无 线 主机 希望 与 之 进行 通信 的 更 大 网 络 
在 讨论 lo ald ob 我 们 注意 到 这 些 构件 能 够 以 多 种 不 同方 式 组 合 以 拒 成 
不 同类 型 的 无 线 网 络 。 当 阅读 本 章 ， 或 阅读 /学 习 本 书 之 外 的 更 多 有 关 无 线 网 络 的 内 容 时 ， 
你 可 能 发 现 对 这 些 无 线 网 络 类 型 进行 分 类 的 方法 是 有 用 的 。 在 最 高 层次 ， 我 们 能 够 根据 两 
个 准则 来 对 无 线 网 络 分 类 : (在 该 无 线 网 络 中 的 分 组 是 否 跨 越 了 一 个 无 线 跳 或 多 个 无 线 
Bk; 人) 网 络 中 是 和 否 有 诸如 基站 这 样 的 基础 设施 。 
o 单 跳 ， 基 于 基础 设施 。 这 些 网 络 具 有 与 较 大 的 有 线 网 络 (如 因特网 ) 连接 的 基站 
此 外 ， 该 基站 与 无 线 主 机 之 间 的 所 有 通信 都 经 过 一 个 无 线 跳 .你 在 教室 、 咖 啡 屋 
或 图 书馆 中 所 使 用 的 802. 11 网 络 ， 以 及 我 们 将 很 快 学 习 的 3G 蜂 雹 网 络 部 属于 这 


种 类 型 ， 

e 单 叱 无 基础 设施 。 在 这 些 网 络 中 ， 不 存在 与 无 线 网 络 相连 的 基站 。 然 而 ， 如 我 
们 将 要 见 到 的 那样 在 这 种 单 跳 网 络 中 的 一 个 结 点 可 以 协调 其 他 结 点 的 传输 。 A 
牙 网 络 (我 们 将 在 6. 3. 6 节 学 习 ) 和 具有 自 组 织 模 式 的 802. 11 网 络 是 单 跳 、 

础 设施 的 网 络 . 


e 多 跳 ， 基 于 基础 设施 ,在 这 些 网 络 中 ， 一 个 基站 表现 为 以 有 线 方式 与 较 大 网 络 相 
连 。 然 而 ， 某 种 无 线 结 点 为 了 经 该 基站 通信 ， 可 能 不 得 不 通过 其 他 无 线 结 点 中 继 
它们 的 通信 。 革 些 无 线 传 感 网 络 和 所 谓 无 线 网 状 网 络 (wireless mesh network) 就 


属于 这 种 类 型 。 

© 多 跳 ， 无 基础 设施 。 在 这 些 网 络 中 没有 基站 ， 并 且 结 点 为 到达 el asa AM 
在 几 个 其 他 无 线 结 点 之 间 中 继 报 文 。 结 点 也 可 能 是 移动 的 ， 在 多 个 结 点 中 改变 
接 关 系 ， 一 类 网 络 被 称 为 移动 自 组 织 网 络 ( mobile ad hoc network, MANET). 
果 该 移动 结 点 是 和 车载 的 ， 该 网 络 是 车 载 自 组 织 nh rd aan 
VANET) 。 如 你 可 能 想象 的 那样 ， 为 这 种 网 络 开发 协议 是 一 种 挑战 ， 这 是 许多 进行 
中 的 研究 主题 


在 本 章 中 ， 我 人 ] 将 把 主要 学 习 内 容 限 制 在 单 跳 网 络 ， 并 且 大 多 数 是 基于 基础 设施 的 网 络 . 
现在 我 们 更 深 一 步 地 研究 无 线 网 络 和 移动 网 络 面 对 的 挑战 。 我 们 将 首先 讨论 单独 的 无 
线 链 路 ， 而 在 本 章 稍 后 部 分 讨论 移动 性 。 


无线 网 乡 和 移动 网 络 
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6.2 无 线 链 路 和 网 络 特征 

我 们 开始 考 虚 用 一 侣 有 线 以 太 网 交换 机 互联 主机 的 一 个 简单 有 线 网 络 ， 如 一 个 家 性 网 
络 (参见 5.4 节 ) ”如 时 我 们 用 无 线 802. 11 网 络 代替 该 有 线 以 太 网 ， 用 无 线 网 络 接口 代替 
主机 的 有 线 以 太 网 接口 ， 用 接 入 


点 代替 以 太 网 交换 机 ， 但 实际 上 在 网 络 层 及 其 以 上 层次 中 
es 化 . 这 提示 我 们 当 寻 找 有 线 和 无 线 网 络 的 重要 区 别 时 ， 应 该 重点 关注 链 路 
， 我 们 的 稍 能 够 发 现 有 线 链 路 和 无 线 链 路 问 的 许多 重要 区 诈 : 


o 递减 的 信号 强度 。 电磁 波 在 穿 过 物体 (如 无 线 电 信号 穿 过 增 壁 ) 时 强度 将 减弱 。 
即使 在 自由 空间 中 ,信和 号 仍 将 扩散 ， 这 使 得 信号 强度 随 看 发 送 方 和 接收 方 忠 离 的 
增加 而 减弱 (有 了 时 称 其 为 路 径 损耗 ( path loss) ) . 

来 自 其 他 源 的 干扰 .在 同一 个 频段 发 送信 号 的 电波 源 将 相互 干扰。 

线 电话 和 802. 11b 无 线 LAN 在 相同 的 频段 中 传输 。 因 此 ，802. 11b 无 线 LAN 用 户 若 

同时 利用 2.4GHz 无 线 电 话 通 信 ， 将 会 导致 网 络 和 电话 都 不 会 工作 得 特别 好 。 际 了 来 

自发 送 源 的 干扰 ， 环 境 中 的 电磁 噪声 ( 如 附近 的 电动 机 、 微 波 ) 也 能 形成 干扰 . 

e 多 径 传播 。 当 电磁 波 的 一 部 分 受 物体 和 地 面 反 射 ， 在 发 送 方 和 接收 方 之 间 走 了 不 同 
长 度 的 路 径 ， 则 会 出 现 多 径 传播 (multipath propagation ) 。 这 使 得 接收 方 收 到 的 信号 
变 得 模糊 .位 于 发 送 方 和 接收 方 之 间 的 移动 物体 可 导致 多 径 传 播 随 时 间 而 改变 . 

对 于 无 线 信 道 特征 、 模 型 和 测量 的 详细 讨论 请 参 

上 述 讨论 表明 ， 


例如 ，2.4GHz 无 


>L | Anderson 1995 | 
无 线 链 路 中 的 比特 差错 将 比 有 线 链 路 中 更 为 常见 。 因此， 无 线 链 路 协 


* (如 我 们 将 在 下 面 一 节 中 讨论 的 802. 11 协 以 ) 不 仅 采 用 有 效 的 CRC Fie Relay, AK 
] 了 链 路 层 ARQ 协议 来 重 传 受 损 的 帧 . 


考虑 了 在 无 线 信 道上 可 能 出 现 的 损伤 后 ， 我 们 将 注意 力 转 回 接 收 无 线 信号 的 主机 : 
主机 接收 到 一 个 电磁 信号 ， 而 该 信号 是 发 送 方 传输 的 初始 信号 的 退化 形式 和 环境 中 的 
噪声 的 结合 ， 其 中 的 信号 退化 是 由 于 衰减 和 我 们 前 面 讨 论 过 的 多 路 径 传播 以 及 其 他 一 
素 所 引起 的 。 信 噪 比 (Signal-to-Noise Ratio, SNR) 是 所 收 到 的 信号 (如 被 传输 的 信息 ) 
和 噪声 强度 的 相对 测量 。SNR 的 度量 单 a — (dB)， 有 人 认为 这 个 主要 由 电气 工 
程 师 所 使 用 的 度量 单位 会 使 计算 机 科学 家 迷 
不 解 . 以 dB 度量 的 SNR 是 下 列 比值 的 20 K 

即 接收 到 的 信号 的 振幅 与 噪声 的 振幅 的 以 10 为 


底 的 对 数 的 比值 。 就 我 们 的 讨论 目的 而 言 ， 我 







一 QAM16 s- - QAM256 
(4Mpbs ) : ( 8Mpbs ) 


们 仅 需要 知道 较 大 的 SNR 使 接收 方 更 容易 从 背 。“ 
景 噪声 中 提取 传输 的 信号. 10° \ 
图 6-3 (该 图 选 自 [Holland 2001]) 显示 了 © | 
三 种 不 同 的 调制 技术 的 比特 差错 率 (BER) (大 
BORK, BER 是 在 接收 方 收 到 的 有 错 传 输 比 特 的 。 io* | 
H) 与 SNR 之 比 ， 这 些 调制 技术 用 于 对 信息 进 | 
行 编码 以 在 理想 信道 上 传输 。 pr pie mk: a 
及 信和 号 提取 和 BER 者 超出 了 本 书 的 汇 轩 (对 这 


SNR (dB) 


主题 的 讨论 参见 【Schwart 1980 | ) 尽管 oe 图 6-3 比特 差错 率 、 传 输 率 和 SNR 


> 
? 
CN 
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图 6-3 显示 了 几 种 物理 层 的 特征 ， 这 些 特 征 对 于 理解 较 高 层 无 线 通 信 协 以 是 重要 的 : 

o 对 于 给 定 的 调制 方案 ，SNR AB, BER AK. 由 于 发 送 方 通过 增加 它 的 传输 功率 
就 能 够 增加 SNR， 因 此 发 送 方 能 够 通过 增加 它 的 传输 功率 来 降低 接收 到 差错 帧 的 
概率 。 然 而 ， 注 意 到 当 该 功率 超过 某 个 阅 值 时 ， 如 BER 从 10 “降低 到 10- ， 可 
证 明 几 乎 不 会 有 实际 增益 。 增 加 传输 功率 也 会 伴随 肴 一 些 缺 点 : 发 送 方 必须 消耗 
更 多 的 能 量 (对 于 用 电池 供电 的 移动 用 户 ， 这 一 点 非常 重要 ) ， 并 且 发 送 方 的 传输 
更 可 能 干扰 男 一 个 发 送 方 的 传输 (参见 医 6-4b)。 

e 对 于 给 定 的 SNR， 具 有 较 高 比特 传输 率 的 调制 技术 (无 论 差错 与 否 ) 将 有 具有 较 高 
的 BER。 例 如 在 图 6-3 中 ， 对 于 10dB AY SNR, ELA I Mbps 传输 速率 的 BPSK 调制 
县 有 小 于 10 一 的 BER, 而 具有 4Mbps 传输 速率 的 QAM 16 调制 ， BER 是 10…， 该 
值 太 高 而 没有 实际 用 处 。 然而， 具有 20dB 的 SNR, QAM 16 调制 具有 4Mbps 的 传 
输 速 率 和 10 ”的 BER, Mi BPSK 调制 具有 仅 1Mbps 的 传输 速率 和 一 个 低 得 “无 法 
在 图 上 表示 ”的 BER。 如 果 人 们 能 够 容忍 10 ”的 BER， 在 这 种 情况 下 由 QAM 16 
提供 的 较 高 的 传输 速率 将 使 它 成 为 首选 的 调制 技术 .这些 考虑 引出 了 我 们 下 面 描 
述 的 最 后 一 个 特征 。 

e 物理 层 调制 技术 的 动态 选择 能 用 于 适 配 对 信道 条 件 的 调制 技术 。 SNR (因此 BER) 
可 能 因 移 动 性 或 由 于 环境 中 mn 而 变化 。 在 蜂 需 数据 系统 中 以 及 在 802. 11 WiFi 
和 3G 蜂窝 数据 网 络 中 (我 们 将 在 6.3 节 和 6.4 A) 使 用 了 目 适 应 调制 和 编 
码 。 例 如 ， 这 使 得 对 于 给 定 的 信道 特征 选择 一 种 调制 技术 ， 在 受制 于 BER 约束 的 
前 提 下 提供 最 高 的 可 能 传输 速率 ， 

有 线 和 无 线 链 路 之 间 的 差异 并 非 仅 仅 只 有 较 高 的 、 时 变 的 误 比 特 率 这 一 项 。 前 面 讲 过 
在 有 线 广播 链 路 中 所 有 结 点 能 够 接收 到 所 有 其 他 结 点 的 传输 。 而 在 无 线 链 路 中 ， 情 况 并 非 
如 此 简单 。 如 图 6-4 所 示 ， 假 设 站 点 A 正在 向 站 点 B 发 送 ， 假 定 站 点 C 也 在 回 站 点 B 传 
会 。 由 于 所 谓 的 隐藏 终端 问题 (hidden terminal problem) EME A Al C 的 传输 确实 是 在 日 
的 地 B 发 生 干 扰 ， (例如 ， 一 座 大 山 或 者 一 座 建 筑 ) 也 可 能 会 妨碍 A 和 C 
ee 这 种 情况 如 网 6-4a 所 示 。 第 二 种 导致 在 接收 方 无 法 检测 的 碰撞 情 

erra 号 强度 的 衰减 (fading). KI 6-4b 图 示 了 这 种 情况 ，A AIC 
meee 它们 的 信号 强度 不 足以 使 它们 相互 检测 到 对 方 的 传输 ， 然 而 它们 的 传输 足 
以 强 到 在 站 点 B 处 相互 十 扰 。 ea 6. 3 节 看 到 的 那样 ， 隐 藏 终端 问题 和 衰减 使 得 
多 路 访问 在 无 线 网 络 中 的 复杂 性 十 高 于 在 有 线 网 络 中 的 情况 。 





3 
sied -i pe 
i pe 
aa 
Le a ———— EEE SS 
位 置 
a) 隐藏 终端 问题 b) FEW. 


图 6-4 ”隐藏 终端 问题 和 衰减 


KK Wh) Fok WMA 347 











CDMA 


在 第 5 RYE, SANA EBLE — TEER an a, mi A PS DOR RE BE 
送 方 发 送 的 信号 不 在 接收 方 互 相 十 扰 . 在 第 5 章 中 ,我 们 描述 了 3 类 媒体 访问 协议 : 信道 
划分 、 随 机 访问 和 轮流 。 码 分 多 址 (Code Division Multiple Access, CDMA) 属于 信道 划分 
协议 一 族 。 它 在 无 线 LAN 和 蜂 窗 技术 中 应 用 很 广泛 由 于 CDMA 对 无 线 领域 十 分 重要 ， 
在 后 面 小 三 中 对 有 具体 的 无 线 接 入 技术 进行 探讨 以 前 ， 我 们 首先 对 其 快速 地 浏 完 一 

在 CDMA 协议 中 ， 要 发 送 的 每 个 比特 都 通过 乘 以 一 个 信号 (编码 ) 的 比特 来 进行 编 
码 ， 这 个 信号 的 变化 速率 (GHA PK AB ARE, chipping rate) 比 初 始 数据 比特 序列 的 变 
化 速率 快 得 多 。 图 6-5 表示 一 个 简单 的 、 理 想 化 的 CDMA 编码 / 解 但 情形 .假设 初始 数据 
比特 到 达 CDMA 编 但 需 的 速率 定义 了 时 间 单 元 ; 也 就 是 说 ， 每 个 要 发 送 的 初始 数据 比特 需 
要 1 比特 时 际 时 间 。 设 d; 为 第 i 个 比特 时 际 中 的 数据 比特 值 。 为 了 数学 上 便利 我们 把 具 
有 0 值 的 数据 比特 表示 为 - 1。 每 个 比特 时 际 又 进一步 细 分 为 M4 个 微 时 际 ; 在 图 6-5 中 ， 
M =8， 不 过 在 实际 中 Wi 的 值 要 大 得 多 .发送 方 使 用 的 CDMA 编码 由 M 个 值 的 一 个 序列 en 
组 成 , mal, =, M, PEP +1 或 者 -1, 在 图 6-5 的 例子 中 ， 被 发 送 方 使 用 的 MM 比 
特 的 CDMA 码 是 (1, 1, 1, -1, 1, -1, -1, -1). 


RIE Ti 信道 输出 Z, „n 


E mm 






EPE E a ERE 
0 HRI MHO 
| 信道 输出 信道 输出 


接收 方 









If BRO 
接收 的 输入 


图 6-5 一 个 简单 的 CDMA 例子 : 发送 方 编码 ， 接 收 方 解 码 
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为 了 说 明 CDMA 的 工作 原理 ， 我 们 天 注 常 个 数据 比特 d,，， 对 于 4 比特 传输 时 间 的 第 
1 个 微 时 际 ，CDMA ee Z: m 是 d, 到 以 分 配 的 CDMA a 的 第 m 比特 e,, : 
E Sa, (6-1) 


简单 地 说 ， 对 没有 十 扰 的 发 送 方 ， 接 收 方 将 收 到 编码 的 1 EFF Zin ， 并 且 恢 复 初始 的 数 
据 比 特 d, ， 计 算 如 下 : 


ET 
d, = ua Le RE (6-2) 
Beer MEAG HE ee A] 6-5 所 示例 子 的 细节 ， 来 明白 使 用 式 (6-2) 在 接收 方 确实 正确 恢 


复 了 初始 数据 比特 

然而 ， 这 个 世界 远 不 是 理想 化 的 ， 如 工 面 所 述 ，CDMA 必须 在 存在 干扰 发 送 方 的 情况 
下 工作 .这 些 发 送 方 用 分 配 的 不 同 编码 来 编码 和 传输 它们 的 数据 但 是 当 一 个 发 送 方 的 数 
据 比 特 和 其 他 发 送 方 发 送 的 比特 混在 一 起 时 ， 一 个 CDMA 接收 方 怎样 恢复 该 发 送 方 的 初始 
数据 比特 呢 ? CDMA 的 工作 有 一 种 假设 ， 即 aes 比特 信号 是 加 性 的 ， 这 意味 着 ， 
例如 在 同一 个 微 时 际 中 ， 如 果 3 个 发 送 端 都 发 送 1， 第 4 Wa 端 发 送 - 1， 那么 在 那个 微 


时 隆 中 所 有 的 接收 方 接收 的 信号 部 是 2 (PIA 1 +1 4+1-1=2). 在 存在 多 个 发 送 方 时 ， 发 
送 方 s 计算 它 编码 后 的 传输 Z',，， 计 算 方 式 与 式 (6-1) ane 然而 在 第 i 个 比特 


时 阶 的 第 m 个 微 时 际 期 间 ， 接 收 方 现在 收 到 的 值 是 在 那个 微 时 际 中 从 所 及 个 发 送 方 传 
得 的 比特 的 总 和 


\ 


= ÈZ 
令 人 吃惊 的 是 ， 如 果 仔 细 地 选择 发 送 方 的 编码 ， 每 个 接收 方 只 et 6-2) 中 的 同 
伴 的 方式 使 用 发 送 方 的 编码 ， 就 能 够 从 聚合 的 信号 中 恢复 一 个 给 定 的 发 送 方 发 送 的 数据 : 


Pie 
d = Tee xc. (6-3) 


图 6-6 中 ， 摘 述 了 两 个 发 送 方 的 CDMA 例子 。 上 部 的 发 送 方 使 用 的 M 比特 CDMA 
编码 是 (1, 1, 1, -1. 1, -1, -1, -1), 而 下 部 的 发 送 方 使 用 的 CDMA Hati ie 
(1, -1, 1, 1, 1, -1, 1, 1). 图 6-6 描述 了 一 个 接收 方 恢复 从 上 部 发 送 方 发 送 的 初 
始 数 据 比 特 的 情况 .注意 到 这 个 接收 方 能 够 提取 来 目 发 送 方 1 的 数据 ， 而 不 管 来 自发 送 
方 2 的 干扰 传输 。 

冉 回 到 我 们 第 S 间 中 鸡尾酒 会 的 类 比 ， 一 个 CDMA 协议 类 似 于 让 聚会 客人 使 用 多 种 语 
言 来 谈论 ; 在 这 种 情况 下 ， 人 们 实际 上 非常 善于 锁定 他 们 能 听 异 的 语言 的 谈话 ， 而 过 滤 了 了 
其 余 的 谈话 ， 我 们 这 里 看 到 CDMA 是 一 个 划分 协议 ， 因 为 它 划 分 编码 空间 (与 时 间或 频 
率 相 对 ) ， 并 且 给 每 个 结 点 分 配 一 段 专用 的 代码 空间 。 

我 们 这 里 对 CDMA 的 讨论 是 简要 的 ; 实践 中 还 必须 处 理 大 量 的 困难 问题 、 首 先 ， 为 了 
使 CDMA 接收 方 能 够 提取 一 个 特定 的 发 送 方 的 信号 ， 必 须 仔 细 地 选择 CDMA RK., 
我 们 的 讨论 假设 在 接收 方 接收 到 的 来 自从 不 同 发 送 方 的 信号 强度 是 相同 的 ; 这 可 能 在 实际 
中 很 难 获 得 . 有 大 量 的 文 曹 讨论 了 了 有关 CDMA 的 这 些 和 其 他 问题 ; 详细 ns ZIL | Pickholtz 
1982; Viterbi 1995 | - 
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发 送 方 





图 6-6 两 个 发 送 方 的 CDMA 例子 


6.3 WiFi: 802. 11 无 线 LAN 


当前 ， 无 线 LAN 在 工作 场所 、 家 庭 、 教 育 机 构 、 咖 啡 屋 、 机 场 以 及 街头 无 所 不 在 ， 
它 已 经 成 为 因特网 中 的 一 种 十 分 重要 的 接 人 网 技术 。 尽 管 在 20 世纪 90 年 代 研 发 了 许多 有 
关 无 线 LAN 的 标准 和 技术 , 但 其 中 有 一 类 标准 已 经 明显 成 为 了 赢家 : IEEE 802. 11 无 线 
LAN (也 称 为 WiFi) 。 在 本 节 中 ,我 们 将 详细 研究 802. 11 无 线 LAN， 分 析 它 的 帧 结构 、 
它 的 媒体 访问 协议 以 及 802. 11 LAN 与 有 线 以 太 网 LAN 的 互联 。 

有 几 大 有关 无 线 LAN 的 802. 11 标准 ， 包 括 802. 11b、802. 11a 和 802. 11g。 表 6-1 总 
结 了 这 些 标准 的 主要 特征 。802. 11g 是 至 今 为 止 最 为 流行 的 技术 。 一些 双 模 式 (802. 11a/g) 
和 三 模式 (802. 11a/b/g) 设备 也 可 供 使 用 。 
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# 6-1 IEEE 802. 11 标准 小 结 











标准 频率 范围 数据 率 
802. 11b 2, 4 ~2. 4835GHz ieis A 11 Mbps 
802. lla 5.1 ~5. 8GHz iy ity Ay S4Mbps 
802. Ilg 2.4 ~2. 485CHz 最 高 为 54Mbps 


这 3 个 802. 11 标准 有 具有 许多 共同 特征 。 它 们 都 使 用 相同 的 媒体 访问 协议 CSMA/CA, 
我 们 稍 后 将 对 其 进行 讨论 ， 这 3 个 标准 都 对 它们 的 链 踏 层 帆 使 用 和 i 格式， appt 
Ai RIE EEL ENA E cP BSE TT. 并 且 这 3 个 标准 都 允许 “基础 设施 模式 ”和 “ 

组 织 模 式 ” 两 种 模式 .然而 ， 如 表 6-1 所 示 ， 这 3 个 标准 在 物理 层 有 一 些 重要 的 区 别 . 

802. 11b 无 线 LAN 具有 11Mbps 的 数据 率 ， 工 作 在 非 许可 证 的 2.4 ~2.4835GHz 的 无 线 
频谱 上 ， 与 2.4GHz 电话 和 微波炉 争 用 频谱 。802. 11a 无 线 LAN 可 以 以 高 得 多 的 比特 率 工 
作 ， 但 它 在 更 高 的 频率 上 运行 。 然 而 ， 由 于 运行 的 频率 更 高 ，802. lla LAN 对 于 给 定 的 功 
率 级 别传 输 距 离 较 短 ， 并 且 它 受 多 径 传 播 的 影响 更 大 。802. 11g LAN 与 802. 11b LAN 工作 
在 同样 的 较 低 频段 上 上， 并且 与 802.11b 回 后 兼容 (这样 你 能 够 逐步 地 升级 802. 11b 的 客 
户 ) ， 而 且 与 802. 11a 有 相同 的 高 传输 速率 ， 使 得 用 户 能 够 更 好 地 盏 受 网 络 服务 。 

一 个 相对 新 的 WiFi 标准 802. 11n [IEEE 802. 11n 2012 ] ， 使 用 多 输入 多 输出 (MIMO) 
天 线 ; 即 在 发 送 侧 的 两 个 或 多 个 天 线 和 在 接收 侧 的 两 个 或 多 个 天 线 之 加 发 送 /接收 不 同 a 
信号 | Diggavi 2004 ] 。 根 据 所 使 用 的 调制 方案 ， 每 秒 几 百 兆 比特 的 传输 率 对 于 802. 11n 是 
可 能 的 。 


6.3.1 802.11 体系 结构 


图 6-7 显示 了 802. 11 无 线 LAN penal 802. 11 体系 结构 的 基本 构件 模 
块 是 基本 服务 集 (Basie Service Set, BSS), ~ BBS 包含 一 个 或 多 个 无 线 站 点 和 一 个 在 
802.11 术语 中 称 为 接 入 点 (Access Point, ne m (base station), K] 6-7 展示 了 
两 个 BSS 中 的 AP， 它们 连接 到 一 个 互联 设备 上 (如 交换 机 或 者 路 由 器 ) ， 互 联 设 备 又 连接 
到 因特网 中 。 在 一 个 典型 的 家 庭 网 络 中 ， a AP 和 一 台 将 该 BSS 连接 到 因特网 中 的 路 
Has (通常 综合 成 为 一 个 单元 ). 

与 以 太 网 设备 类 似 ， 每 个 802. 11 无 线 站 点 都 具有 一 个 6 字 节 的 MAC 地 址 ， 该 地 址 存 
fate Awe wi Ac Ar (BP 802. 11 网 络 接口 卡 ) 的 固件 中 : 每 个 AP 的 无 线 接 口 也 具有 一 个 
MAC 地 址 。 与 以 太 网 类 似 ， 这 些 MAC 地 址 由 IEEE 管理 ,理论 上 是 全 球 唯 一 的 。 

如 6.1 节 所 述 ， 配 置 AP 的 无 线 LAN 经 第 被 杯 作 基 础 设施 无 线 LAN (infrastructure 
wireless LAN) ， 其 中 的 “基础 设施 ”是 指 AP at HK AP 和 一 台 路 由 需 的 有 线 以 太 网 ， 
图 6-8 显示 了 IEEE 802. 11 站 点 也 能 将 它们 目 己 组 合 在 一 起 形成 一 个 日 组 织 网 络 ， 即 一 个 

无 中 心 控 制 和 与 “外 部 世界 ”无 连接 的 网 络 . 该 网 络 是 由 彼此 已 经 发 现 相 互 接 近 且 
有 通信 需求 的 移动 设备 “动态 ”形成 ， 并 且 在 它们 所 处 环境 中 没有 预先 存在 的 网 络 基础 设 
施 。 当 携带 便携 机 的 人 们 聚集 在 一 起 时 (例如 ， 在 一 个 会 议 室 、 一 列 火车 或 者 一 辆 汽车 
中 ) ， 并 且 要 在 没有 中 央 化 的 AP 的 情况 下 交换 数据 ， 一 个 自 组 织 网 络 就 可 能 形成 了 。 随 
着 要 通信 的 便携 设备 的 继续 激增 ， 人 们 对 自 组 织 网 络 产 生 巨 大 的 兴趣 。 人 然而 在 本 节 中 ， 我 
们 只 关注 基础 设施 无 线 LAN. 
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信道 与 关联 

fE 802.11 中 ， 每 个 无 线 站 点 在 能 够 发 送 或 者 接收 网 络 层 数据 之 前 .必须 与 一 个 AP 相 
Rik. 尽管 所 有 802. 11 标准 都 使 用 了 关联 ， 但 我 们 将 专门 在 正 EE 802. 11b/g 环境 中 讨论 
这 一 主题 。 

当 网 络 管理 员 安 装 一 个 AP 时 ， 管 理 员 为 该 接 和 人 点 分 配 一 个 单字 或 双 字 的 服务 集 标 识 
符 (Service Set Identifier, SSID). (Hun, RE Microsoft Windows XP 中 “查看 可 用 网 络 
nt”, ORR AN SEY AA ES AP AY SSID.) 管理 员 还 必须 为 该 AP 分 配 一 个 信道 号 ,为 了 理 
解 信道 号 ， 回 想 前 面 讲 过 的 802. 11 运行 在 2.4 ~ 2. 4835GHz 的 频段 中 .在 这 85MHz 的 频 
段 内 ，802. 11 定义 了 11 SoBe 当 且 仅 当 两 个 信道 由 4 个 或 更 多 信道 隔 开 时 
它们 才 无 重 鸽 。 特 别 是 信道 1、6 和 11 的 集合 是 唯一 的 3 个 非 重 从 信道 的 集合 。 这 意味 着 
管理 员 可 以 在 同一 个 物理 网 络 中 安装 3 个 802. 11b AP， 为 这 些 AP 分 配 信 道 1、6 和 11， 
然后 将 每 个 AP 者 连接 到 一 人 台 交 换 机 上 。 

既然 已 经 对 802. 11 信道 有 了 基本 了 解 ， 我 们 则 可 以 摘 述 一 个 有 趣 ( 且 并 非 完 全 不 寻 
a) 的 情况 ， 即 有 关 Wiki 从 林 。WiFi 丛林 (WiFi jungle) 是 一 个 任意 物理 位 置 ， 在 这 里 
无 线 站 点 能 从 两 个 或 多 个 AP 中 收 到 很 强 的 信号 。 例 如， 在 纽约 城 的 许多 咖啡 馆 中 ， 无 线 
站 点 可 以 从 附近 许多 AP 中 选取 一 个 信号 。 其 中 一 个 AP 可 能 由 该 咖啡 馆 管理 ， 而 其 他 AP 
可 能 位 于 咖啡 馆 附 近 的 住宅 区 内 。 这 些 AP 中 的 每 一 个 都 可 能 位 于 不 同 的 子 网 中 ， 并 被 独 
立 分 配 二 个 信道 。 

现在 假定 你 带 着 自己 的 便携 机 进入 这 样 一 个 WiFi 从 林 ， 和 寻求 无 线 因特网 接 入 和 一 个 
蓝 每 松 饼 。 设 在 这 个 丛林 中 有 5 个 AP。 为 了 获得 因特网 接 入 ， 你 的 无 线 站 点 需要 加 入 其 
中 一 个 子 网 并 因此 需要 与 其 中 的 一 个 AP 相关 联 (associate ) 。 关 联 意味 着 这 一 无 线 站 点 在 
自身 和 该 AP 之 间 创 建 一 个 虚拟 线路 。 特 别 是 ， 仅 有 关联 的 AP 才 向 你 的 无 线 站 点 发 送 数 
据 帧 ， 并 且 你 的 无 线 站 点 也 仅仅 通过 该 关联 AP 回 因 特 网 发 送 数据 帧 。 然 而 ， 你 的 无 线 站 
点 是 如 何 与 某 个 特定 的 AP 相关 联 的 ?更 为 根本 的 问题 是 ， 你 的 无 线 站 点 是 如 何 知 道 哪个 
AP 位 于 丛林 中 的 呢 ? 

802. 11 标准 要 求 每 个 AP 周期 性 地 发 送信 标 帧 (beacon frame) ， 每 个 信和 标 帧 包括 该 AP 
的 SSID 和 MAC 地 址 。 你 的 无 线 站 点 为 了 得 千 正 在 发 送信 标 帧 的 AP， 扫描 11 个 信道 ， 找 
出 来 目 可 能 位 于 该 区 域 的 AP 所 发 出 的 信 标 帧 ( 其 中 一 些 AP 可 能 在 相同 的 信道 中 传输 ， 





即 这 里 有 一 个 丛林 !1) 。 通 过 信 标 帧 了 解 到 可 用 AP 后 ,你 (或 者 你 的 无 线 主机 ) 选择 一 个 
AP JH EK. 

802. 11 标准 没有 指定 选择 哪个 可 用 的 AP 进行 关联 的 算法 ; 该 算法 被 遗留 给 802. 11 
回 件 和 无 线 主 机 的 软件 设计 者 。 通常 ， 主 机 选择 接收 到 的 具有 最 高 信号 强度 的 信 wae H 
然 高 信号 强度 好 (例如 可 参见 图 6-3) ， 信 号 强度 将 不 是 唯一 决定 主机 接收 性 能 的 AP FF 
性 。 特 别 是 ， Miragen AP ny Hie Asha 's, (AA) Te BARA EBL OH Ti ESE EIA AP 
的 无 线 带宽 ) 所 过 载 ， 而 某 未 过 载 的 AP 由 于 稍 弱 的 信号 而 未 被 选择 。 选 择 AP 的 一 些 可 
BARAJA de | Vasudevan 2005; Nicholson 2006; Sudaresan 2006]. 有关 信号 
强度 如 何 测量 的 有 趣 而 朴实 的 讨论 参见 [ Bardwell 2004 | 。 

扫 摘 信道 和 监听 信和 标 帧 的 过 程 被 称 为 被 动 扫描 (passive scanning) ( 参 风 图 6-9a), 无 
线 主机 也 能 够 执行 主动 扫描 (active scanning) ， 这 是 通过 加 位 于 无 线 主 机 沪 用 内 的 所 有 AP 
I ER 元 成 的 ， 如 图 6-9b ras. AP 用 一 个 探测 响应 帧 应 答 探 测 请 求 帧 。 无 线 主机 则 

TENS A Mol ye) AP 中 选择 某 AP 与 之 相关 联 。 





BBS 1 BBS 2 BBS | BBS 2 
À (aay AS 
AP | TIS $> 

HI 
a) 被 动 扫描 b) 主动 扫描 

全 自 AP 发 送信 标 帧 OAHU HRW Bf OR hi 

CHI 向 选择 的 AP 发 送 关联 请 求 帧 D A AP REPKI N R 

(DEFE RAP EH 1 AGE K PK e V pi CGIH1 项 选择 的 AP 发 送 关 联 请 求 帧 


(9 选择 的 AP 向 Hl 发送 关联 的 啊 应 帧 
图 6-9 ”对接 入 点 的 主动 和 被 动 扫 描 


选 定 与 之 关联 的 AP 后 ， 无 线 主 机 向 AP 发 送 一 个 关联 请 求 帧 ， 并 且 该 AP 以 一 个 关联 
响应 帧 进行 响应 。 注意 到 对 于 主动 扫描 需 要 这 种 第 二 次 请 求 / 啊 应 握手 ， 因 为 一 个 对 初始 
探测 请 求 帧 进行 响应 的 AP 并 不 知道 主机 选择 哪个 〈 可 能 多 个 ) 啊 应 的 AP 进行 关联， 这 
与 DHCP 客户 能 够 从 多 个 DHCP 服务 器 进行 选择 有 诸多 相同 之 处 〈 参 见 网 4-21 ) . 一旦 与 
一 个 AP 关联 ， 该 主机 希望 加 入 该 AP 所 属 的 子 网 中 (以 4.4.2 市 中 的 IP 寻 址 的 意义 ) 
因此 .该 主机 通常 将 通过 关联 的 AP 回 该 子 网 发 送 一 个 DHCP 发 现 报 文 (参见 图 4-21), 
以 获取 在 该 AP 子 网 中 的 一 个 IP 地址。 一 旦 获得 地 址 ， 网 络 的 其 他 部 分 将 直接 视 你 的 主机 
为 该 子 网 中 的 另 一 台 主 机 . 

为 了 与 特定 的 AP 创建 一 个 关联 ， 某 无 线 站 点 可 能 要 同 该 AP 鉴别 它 目 身 。802. 11 无 
线 LAN 提供 了 几 种 不 同 的 鉴别 和 接 人 方法 。 一 种 被 许多 公司 采用 的 方法 是 ， 基 于 一 个 站 
点 的 MAC 地 址 允许 其 接 入 一 个 无 线 网 络 。 第 二 种 被 许多 因特网 咖啡 屋 采 用 的 方法 是 ， 应 
用 用 户 名 和 口令 。 在 两 种 情况 下 ，AP 通常 与 一 个 鉴别 服务 郑 进 行 通信 ， 使 用 一 种 应 如 
RADIUS| RFC 2865] 或 DIAMETERI RFC 3588] 的 协议 ， CERES Set Se HA ae NR AE Ak ME 
PAK. SPEYER AeA AP, (1G — PE SIRS HET WIR Fe AP, 将 AME 
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敏感 的 ) 鉴别 和 接 入 的 决定 集中 到 单一 服务 器 中 ,使 AP 费用 和 复杂 性 较 低 。 我 们 将 在 
8.8 WHF, we 802. 11 协议 族 安全 性 的 新 IEEE 802. 11i 协议 就 恰好 采用 了 这 一 方法 : 


6.3.2 802.11 MAC 协议 


某 无 线 站 点 与 一 个 AP 相关 联 ， 它 就 可 以 经 该 接 和 人 点 开始 发 送 和 接收 数据 帧 。 
而 因 多 可 人 T 望 同时 经 相同 信道 传输 数据 帧 ， aici 一 se 
这 里 ， 站 点 (station) 可 以 是 一 个 无 线 站 点 ， 或 者 是 一 个 AP。 正 如 在 第 5 章 和 
. 1 二 中 讨论 的 那样 ， 宽 泛 地 讲 有 三 类 多 路 访问 协议 : 信道 划分 (包括 CDMA), 、 随 机 
sie Ee 流 。 受 以 太 网 及 其 随机 访问 协议 巨大 成 功 的 鼓舞 ，802. 11 的 设计 者 为 802. 11 无 
Zk LAN 选择 了 一 种 随机 访问 协议 。 这 个 随机 访问 协议 称 作 带 碰撞 避免 的 CSMA (CSMA 
with collision avoidance), BY fil #K-A CSMA/CA. 与 以 太 网 的 CSMAZCD 相似 ，CSMAZCA 中 
的 “CSMA” 人 代表“ 载波 侦 听 多 路 访问 ”， 意 味 着 每 个 站 点 在 传输 之 前 侦 听 信道 ， 并 且 一 
日 侦 听 到 该 信道 忙 则 抑制 传输 。 尽 管 以 太 网 和 802.11 都 使 用 载波 侦 听 随机 接 入 ,但 这 两 
种 MAC 协议 有 重要 的 区 别 。 首先 ，802. 11 使 用 碰撞 避免 而 非 碰 撞 检 测 ; 其 次 ， 由 于 无 线 
言 让 相对 较 高 的 误 比 特 率 ，802. 11 (不 同 于 以 太 网 ) 使 用 链 路 层 确认 / 重 传 (ARQ) 方 
K. 我 们 将 在 下 面 讨论 802. 11 的 碰撞 避免 和 链 路 层 确 认 机 制 。 
在 5.3.2 玫 和 5.4.2 曾 讲 过 ， 使 用 以 太 网 的 碰撞 检测 算法 ， 以 太 网 结 点 在 发 送 过 程 
中 监听 信道 。 在 发 送 过 程 中 如 果 检 测 到 另 一 结 点 也 在 发 送 ， 则 放弃 上 自己 的 发 送 ， 并 且 在 等 
待 一 个 小 的 随机 时 间 后 再 次 发 送 。 与 802. 3 以 太 网 协议 不 同 ， 802. 11 MAC 协议 并 未 实现 碰 
撞 检 测 . 这 主要 由 两 个 原因 所 致 : 
e 检测 碰撞 的 能 力 要 求 站 点 具有 同时 发 送 【( 站 点 目 己 的 信和 号) 和 接收 (检测 其 他 站 
点 是 否 也 在 发 送 ) 的 能 力 。 因 为 在 802. 11 适配器 上 ， 接 收 信号 的 强度 通 第 远 十 小 
于 发 送信 号 的 强度 ， 制 造 具 有 检测 碰撞 能 力 的 硬件 代 价 较 大 。 

。 更 重要 的 是 ， 即 使 适 配 郑 可 以 同时 发 送 和 监听 信号 (并 且 假 设 它 一 旦 侦 听 到 信道 
忙 就 放弃 发 送 ) ， 适 配 需 也 会 由 于 隐藏 终端 问题 和 衰减 问题 而 无 法 检测 到 所 有 的 碰 
撞 ， 参 见 6. 2 节 的 讨论 。 

由 于 802. 11 无 线 局 域 网 不 使 用 碰撞 检测 ， Png 点 开始 发 送 一 个 帧 ， 它 就 完全 地 发 
XA; 也 就 是 说 ， 一 旦 站 点 开始 发 送 ， 就 不 会 ， 正如 人 人们 可 能 猜想 的 那样 ， 磁 撞 存 
在 时 仍 发 送 整个 数据 帧 (尤其 是 长 数据 帧 ) ee 为 了 降低 碰 
撞 的 可 能 性 ，802. 11 采用 几 种 碰撞 避免 技术 ， 我 们 稍 后 讨论 它们 。 

然而 ， 在 考虑 碰撞 避免 之 前 ， 我 们 首先 需要 分 析 802. 11 的 链 路 层 确认 (link- layer 
acknowledgment) 方案 。6. 2 WHI, KEZ LAN 中 某 站 点 发 送 一 个 帧 时 ， 该 帧 会 由 于 多 
种 原因 不 能 无 损 地 到 达 目 的 站 点 。 为 了 处 理 这 种 不 可 忽视 的 故障 情况 ，802. 11 MAC 使 用 
链 路 层 确 认 。 如 图 6-10 所 示 ， 目 的 站 点 收 到 一 个 通过 CRC 校 验 的 帆 后 ， 它 等 待 一 个 被 称 
作 短 帧 间 间 隔 (Short Inter- Frame Spacing, SIFS) 的 一 小 段 时 间 ， 然 后 发 回 一 个 确认 帧 。 
如 果 发 送 站 点 在 给 定 的 时 间 内 未 收 到 确认 帧 ， 它 假定 出 现 了 错误 并 重 传 该 帧 ， 使 用 CS- 
MA/CA 协议 访问 该 信道 。 如 果 在 奋 干 固定 次 重 传 后 仍 未 收 到 确认 ， 发 送 站 点 将 放弃 发 送 
HEF AW. 

讨论 过 802. 11 如 何 使 用 链 路 层 确认 后 ,我 们 可 以 描述 802. 11 的 CSMA/CA 协议 了 。 
假设 一 个 站 点 (无线 站 点 或 者 AP) 有 一 个 帧 要 发 送 。 
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1) QU RR SE eh ERES, CHE PR ESD aAa a ( Distribu- 
ted Inter- Frame Space, DIFS) 的 短 时 间 段 后 发 送 该 帧 ， 如 图 6-10 所 示 。 

2) 否则， 该 站 点 选取 一 个 随机 回 退 值 〈 如 我 们 
在 S.3.2 节 中 遇 到 的 那样 ) 并 且 在 侦 听 信道 空闲 时 小 
递减 该 值 ， 当 侦 听 到 信道 忙 时 ， 计 数值 保持 不 变 . 

3) 当 计 数值 减 为 0 时 (注意 到 这 只 可 能 发 生 在 
信道 被 侦 听 为 空闲 时 ) ， 该 站 点 发 送 整 个 数据 帧 并 等 
待 确认 - 

4) 如 果 收 到 确认 ， 发 送 站 点 知道 它 的 帧 已 被 目 
的 站 正确 接收 了 。 如 果 该 站 点 要 发 送 另 一 帧 ， 它 将 
从 第 二 步 开 始 CSMA/CA 协议 。 ae ea 
发 送 站 点 将 重新 进入 第 二 步 中 的 回 退 阶 段 ， 并 从 一 
个 更 大 的 范围 内 选取 随机 值 。 i 

前 面 讲 过 ， 在 以 太 网 的 CSMA/CD 的 多 路 访问 协 1 a 
以 (5.3.2 7) F, 一旦 侦 听 到 信道 室 闲 ， 站 点 开始 : : 
发 送 。 然 而 ， 使 用 CSMAZCA ， 该 站 点 在 倒 计 数 时 抑 
制 传输 ， 即 使 它 侦 听 到 该 信道 空闲 也 是 如 此 。 为 什么 
CSMA/CD 和 CSMA/CA 采用 了 不 同 的 方法 呢 ? 

为 了 回答 这 一 问题 ， 我 们 首先 考虑 这 样 一 种 情 

形 : 两 个 站 点 分 别 有 一 个 数据 帧 要 发 送 ， 但 是 ， 由 
于 侦 听 到 第 三 个 站 点 已 经 在 传输 ， 双 方 都 未 立即 发 送 。 使 用 以 太 网 的 CSMA/CD 协议 中 ， 
两 个 站 点 将 会 在 检测 到 第 三 方 发 送 完毕 后 立即 开始 发 送 。 这 将 导致 一 个 碰撞 ， 在 CSMA/ 
CD 协议 中 碰撞 并 非 是 一 个 严重 的 问题 ， 因 为 两 个 站 点 检测 到 碰撞 后 都会 放弃 它们 的 发 送 ， 
从 而 避免 了 由 于 碰撞 而 造成 的 该 帧 剩余 部 分 的 无 用 发 送 。 而 在 802. 11 中 情况 却 十 分 不 同 ， 
因为 802. 11 并 不 检测 碰撞 和 放 奔 发 送 ， 遭 受 碰撞 的 帧 仍 将 被 完全 传输 。 因 此 802. 11 的 日 
标 是 无 论 如 何 尽 可 能 避免 碰撞 。 在 802. 11 中 ， 如 果 两 个 站 点 侦 听 到 信道 忙 ， i 
即 进入 随机 回 退 ,和 希望 选择 一 个 不 同 的 回 退 值 。 如 果 这 些 值 的 确 不 同 ， 一 旦 信道 空闲 ， 
中 的 一 个 站 点 将 在 男 一 个 之 前 发 送 ， 并且 (如果 两 个 站 点 均 未 对 对 方 隐藏 ) arn 
将 会 听 到 “胜利 站 点 ”的 信号 ， 冻 结 它 的 计数 器 ， 并 在 胜利 站 点 完成 传输 之 前 一 直 抑 制 传 
输 。 通 过 这 种 方式 ， 避 免 了 高 代价 的 碰撞 。 当 然 ， 在 以 下 情况 下 使 用 802. 11 仍 可 能 出 现 
碰撞 : 两 个 站 点 可 能 互相 是 隐藏 的 ， 或 者 两 者 可 能 选择 了 非常 靠近 的 随机 回 退 值 ， 使 来 自 
先 开 始 站 点 的 传输 也 必须 到 达 第 二 个 站 点 。 回 想 前 
面 我 们 在 图 5-12 的 环境 中 讨论 随机 访问 算法 时 遇 到 
过 这 个 问题 。 

1. 处理 隐 成 终端 : RTS 和 CTS 

802. 11 MAC 协议 也 包括 了 一 个 极 好 (但 为 可 选 
项 ) 的 预约 方案 ， 以 帮助 在 出 现 隐藏 终端 的 情况 下 Ba E 
避免 碰撞 。 我 们 在 图 6- 11 W PEER el 隐藏 终端 的 例子 ， HI AL HD 
其 中 显示 了 两 个 无 线 站 点 和 一 个 接 入 点 。 这 两 个 无 彼此 互相 隐藏 
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图 6-10 802. 11 使 用 链 路 层 确 认 
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线 站 点 都 在 该 AP A RA (A a ik os WIA). IF APPR SK AP 相关 
He. RIN, FEW, TiS fas ya Fal Jey Be E KI 6-11 所 示 的 阴影 圆 环 内 部 。 因 此 ， 
尽管 每 个 无 线 站 点 对 AP 都 不 隐 城 ， 两 者 彼此 却 是 隐藏 的 。 


现在 我 们 考虑 为 什么 隐藏 终 问 会 导致 出 现 问 题 。 假 设 站 点 Hl 正在 传输 一 个 帧 ， 并 且 
fe HI 传输 的 中 途 ， 站 点 H2 要 问 AP 发 送 一 个 帧 。 让 于 H2 AMEE A Hl 的 传输 ， 它 将 
首先 等 待 一 个 DIFS 间隔 ， 然 后 发 送 该 帧 ， 导 致 产生 了 一 个 碰撞 。 从 而 在 Hl 和 H2 的 整个 
FORGES, (AI AIR IR T 

为 了 避免 这 一 问题 ，IEEE 802.11 协 源 目的 地 所 有 其 他 结 点 


汉人 允许 站 点 使 用 一 个 短 请 求 发 送 (Request 
to Send, RTS) 控制 帧 和 一 个 短 允 许 发 送 
(Clear to Send, CTS) 控制 帧 来 预约 对 信 ODIFS- : 
道 的 访问 。 当 发 送 方 要 发 送 一 个 DATA (i 
时 ， 它 能 够 首先 回 AP 发 送 一 个 RTS W, 
指示 传输 DATA 帧 和 确认 (ACK) 帧 需 
的 总 时 间 。 当 AP 收 到 RTS 帧 后 ， 它 广播 
一 个 CTS 帧 作为 啊 应 。 该 CTS 帧 有 两 个 目 
的 : 给 发 送 方 明确 的 发 送 许可 ， 也 指示 其 ”SIFS 二 
他 站 点 在 预约 期 内 不 要 发 送 。 : 

因此 ， 在 图 6-12 中 ， 在 传输 DATA hi 
前 ，Hl 盲 先 广播 一 个 RTS tol, PA WT HE BR 
其 范围 内 包括 AP 在 内 的 所 有 站 点 听 到 。 
AP 然后 用 一 个 CTS 帧 啊 应 ， 该 帧 也 被 其 
范围 内 包括 HI 和 H2 在 内 的 所 有 站 点 听 到 。 gme i 
站 点 H2 听 到 CTS Ja, fe CTS 帧 中 指明 的 a. ee 
时 间 内 将 抑制 发 送 。RTS 、CTS 、DATA 和 i aiii | 
ACK 帧 如 图 6-12 所 示 ， 

RTS 和 CTS 帧 的 使 用 能 够 在 两 个 重要 图 6-12 使 用 RTS 和 CTS 帧 的 碰撞 避免 
方面 提高 性 能 : 

o 隐藏 终端 问题 被 缓解 了 ， 因 为 长 DATA 帧 只 有 在 信道 预约 后 才 被 传输 。 

e 因为 RTS 和 CTS 帧 较 短 ， 涉 及 RTS 和 CTS 帧 的 碰撞 将 仅 持续 短 RTS 和 CTS 帧 的 持续 

期 。 一 旦 RTS 和 CTS 帧 被 正确 传输 ， 后 续 的 DATA 和 ACK 帧 应 当 能 无 碰撞 地 发 送 。 

建议 读者 去 查看 本 书 配套 网 站 上 的 802. 11 Java 小 程序 。 这 个 交互 小 程序 演示 了 
CSMA/CA 协议 ， 包 括 RTS/CTS 交换 序列 。 

尽管 RTSZCTS 交换 有 助 于 降低 碰撞 ， 但 它 同 样 引 入 了 时 延 以 及 消耗 了 信道 资源 。 因 
Uk, RTS/CTS 交换 仅仅 用 于 为 长 数据 帧 预约 信道 。 在 实际 中 ， 每 个 无 线 站 点 可 以 设置 一 个 
RTS 门限 值 ， 仅 当 帧 长 超过 门限 值 时 ， 才 使 用 RTS/CTS 序列 。 对 许多 无 线 站 点 而 言 ， 默 
认 的 RTS 门限 值 大 于 最 大 帧 长 值 ， 因 此 对 所 有 发 送 的 DATA Wi, RTS/CTS 序列 都 被 跳 过 。 

2. 使 用 802. 11 作为 一 个 点 对 点 链 路 

到 目前 为 止 我 们 的 讨论 关注 在 多 路 访问 环境 中 使 用 802. 11。 应 该 指出 ， 如 果 两 个 结 点 
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每 个 部 具有 一 个 定 问 天 线 ， 它 们 可 以 将 其 定 癌 天 线 指 向 对 方 ， 并 基本 上 是 在 一 个 点 对 点 的 
链 路 上 运行 802. 11 协议 。 如 果 商 用 802. 11 人 硬件 产品 价格 低廉 ， 那 么 使 用 定向 天 线 以 及 增 
加 传输 功率 使 得 802. 11 成 为 一 个 在 数 十 公里 距离 中 提供 无 线 点 对 点 连接 的 廉价 手段 
[ Raman 2007 | 描述 了 这 样 一 个 运行 于 印度 恒 河 郊区 平原 上 的 多 跳 无 线 网 络 ， 其 中 包含 了 
点 对 点 802. 11 链 路 。 
6.3.3 IEEE 802. 11 bå 

JS 802.11 iS UATE a SETA a, B EEI Oe RE A CY 
FP. 8021.11 帆 如 图 6-13 所 示 ， 在 该 帆 上 的 每 个 字段 上 面 的 数字 代表 该 字段 的 字 节 长 
度 ; 在 该 帆 控 制 字 段 中 ， 每 个 子 字 段 上 面 的 数字 代表 该 子 字段 的 比特 长 度 。 现 在 我 们 查看 
该 帧 中 各 字段 以 及 帧 控制 字段 中 一 些 重要 的 子 字 段 . 


帧 〈 数 字 代表 该 字段 的 字 节 长 度 ) : 





图 6-13 802.11 $i 


1. 有效 载 何 与 CRC 字段 
WOT A FKL ae Fy OR oy, EH AE IP 数据 报 或 者 ARP 分 组 组 成 。 尽 管 这 一 字段 
允许 的 最 大 长 度 为 2312 字 节 ， 但 它 通 常 小 于 1500 字 节 ， 放 置 一 个 数据 报 或 一 个 ARP 
分 组 。 如 同 以 太 网 帧 一 样 802.11 帧 包括 一 个 循环 元 余 校 验 (CRC)， 从 而 接收 方 可 以 检 
测 所 收 到 帧 中 的 比特 错误 。 如 我 们 所 看 到 的 那样 ， 比 特 错误 在 无 线 局 域 网 中 比 在 有 线 局 域 
网 中 更 加 普 届 ， 因 此 CRC 在 这 里 更 加 有 用 。 
2. 地 址 字段 
也 许 802. 11 帧 中 最 引 人 注 意 的 不 同 之 处 是 它 具 有 4 个 地 址 字段 ， 其 中 每 个 都 可 以 包 
含 一 个 6 字 节 的 MAC 地 址 。 但 为 什么 要 4 个 地 址 字段 呢 ? 如 以 太 网 中 那样 ， 一 个 源 MAC 
地 址 字段 和 一 个 目的 MAC 地 址 字段 不 就 足够 了 ? 事实 表明 ， 出 于 互联 目的 需要 3 个 地 址 
字段 ， 特 别 是 将 网 络 层 数据 报 从 一 个 无 线 站 点 通过 一 个 AP 送 到 一 台 路 由 天 接 口 。 当 AP 
在 目 组 织 模式 中 互相 转发 时 使 用 第 四 个 地 址 。 由 于 我 们 这 里 仅仅 考虑 基础 设施 网 络 ， 所 以 
只 关注 前 3 个 地 址 字段 。802. 11 标准 定义 这 些 字段 如 下 : 
e 地 址 2 是 传输 该 帧 的 站 点 的 MAC 地 址 。 因 此 ， 如 果 一 个 无 线 站 点 传输 该 帧 ， 该 站 
点 的 MAC 地 址 就 被 插入 在 地 址 2 字段 中 。 类 似 地 ， 如 果 一 个 AP 传输 该 帧 ， 该 AP 
的 MAC 地 址 也 被 插入 在 地 址 2 字段 中 。 
e 地 址 1 是 要 接收 该 帧 的 无 线 站 点 的 MAC 地址 。 因 此 ， 如 果 一 个 移动 无 线 站 点 传输 
该 帧 ， 地 址 1 包含 了 该 目的 AP 的 MAC 地 址 。 类似 地 ， 如 果 一 个 AP 传输 该 帧 ， 
地 址 1 包含 该 目的 无 线 站 点 的 MAC 地 址 。 


无 线 网 络 和 移动 网 乡 gar 








o 为 了 理解 地 址 3， 回 想 BSS (由 AP 和 无 线 站 点 组 成 ) 是 一 个 子 网 的 一 部 分 ， 并 且 
这 个 子 网 经 一 些 路 由 带 接 口 与 其 他 子 网 相连 。 地 址 3 包含 这 个 路 由 可 接口 的 MAC 
Heh- 

为 了 对 地 址 3 的 日 的 有 更 深入 的 理解 ， ges 


.在 这 幅 图 中 ， 有 两 个 AP， 每 个 AP f 
党 一 些 无 线 站 点 。 每 个 AP 到 路 由 大 有 一 
个 直接 连接 ， 路 由 融 依 次 又 连接 到 全 球 因 
特 网 。 我们 应 当 记 住 AP 是 链 路 层 设 备 ， 
它 既 不 能 “说 ”IP 又 不 理解 IP 地 址 。 现 
在 考虑 将 一 个 数据 报 从 路 由 需 接 口 Rl1 移 
到 无 线 站 点 HI1。 路 由 需 并 不 清楚 在 它 和 


我 们 观察 在 图 6-14 环境 中 的 网 络 互 联 的 例 E u 路 由 器 因特网 





BSS 2 
HI 之 间 有 一 个 AP; 从 路 由 需 的 观点 来 说 ， 
H1 仅仅 是 路 由 硕 所 连接 的 子 网 中 的 一 侣 图 6-14 在 802.11 帧 中 使 用 地 址 字段 ， 
主机 {E HI ALRI Ži] A iwi 


e 路 由 带 知 道 Hl 的 IP 地址 (从 数据 报 的 目的 地 址 中 得 到 )， 它 使 用 ARP 来 确定 HI 
的 MAC 地 址 ， 这 与 在 普通 的 以 太 网 LAN 中 相同 。 获 取 Hl 的 MAC 地 址 后 ， 足 由 
arte ll Rl 将 该 数据 报 封 装 在 一 个 以 太 网 帧 中 。 该 帧 的 源 地 址 字段 包含 了 RI 的 
MAC 地 址 ， 目 的 地 址 字段 包含 Hl 的 MAC 地 址 。 
© 当 该 以 太 网 帧 到 达 AP 后， 该 AP 在 将 其 传输 到 无 线 信道 前 ， 抑 将 该 802.3 以 太 网 
由 转换 为 一 个 802. 11 帧 。 如 前 所 述 ，AP 将 地 址 1 和 地 址 2 分 别 填 上 HI 的 MAC 
地 址 和 其 自身 的 MAC 地 址 。 对 于 地 址 3，AP 插 入 RI 的 MAC 地 址 ”通过 这 一 方 
sk, HI 可 以 确定 (从 地 址 3) 将 数据 报 发 送 到 子 网 中 的 路 由 帝 接 口 的 MAC 地址. 
现在 考虑 在 从 Hl 移动 一 个 数据 报到 RI 的 过 程 中 无 线 站 点 Hl 进行 啊 应 时 发 生 的 情况 . 
e HI 生成 一 个 802.11 Wi, W EIR, HH AP HJ MAC 地 址 和 HIl 的 MAC Hohl Hi 
充 地 址 1 和 地 址 2 字段 。 对 于 地 址 3，Hl 插入 R1 的 MAC 地 址 。 
e 当 AP 接收 该 802.11 帧 后 ， 将 其 转换 为 以 太 网 帧 。 该 帧 的 源 地 址 字段 是 Hi 的 
MAC 地 址 ， 目 的 地 址 字段 是 R1 的 MAC 地 址 。 因 此， 地 址 3 允许 AP 在 构建 以 太 
网 帧 时 能 够 确定 目的 MAC Hie 
总 之 ， 地 址 3 在 BSS 和 有 线 局 域 网 互联 中 起 着 关键 作用 。 
3. Jr. FPSO ALE hl BS 
前 面 讲 过 在 802. 11 网 络 中 ， 无 论 何 时 一 个 站 点 正确 地 收 到 一 个 来 自 于 其 他 站 点 的 帧 ， 
它 就 回 发 一 个 确认 。 因 为 确认 可 能 会 丢失 ， 发送 站 点 可 能 会 发 送 一 个 给 定 幅 的 多 个 副本 。 
正如 我 们 在 rdt2. 1 协议 讨论 中 所 见 (3.4.1 节 )， 使 用 序号 可 以 使 接收 方 区 分 新 传输 的 帧 
和 以 前 帧 的 重 传 。 因 此 在 802. 11 帧 中 的 序号 字段 在 链 路 层 与 在 第 3 草 中 运输 层 中 的 该 字 
段 有 着 完全 相同 的 目的 。 
前 面 讲 过 802. 11 协议 允许 传输 结 点 预约 信道 一 段 时 间 ， 包 括 传 输 其 数据 帧 的 时 间 和 
传输 确认 的 时 间 。 这 个 持续 期 值 被 包括 在 该 帧 的 持续 期 字段 中 (在 数据 帧 和 RTS 及 CTS 
WPF E). 
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如 网 6-13 所 示 ， 帆 控制 字段 包括 许多 子 字 段 ， 我 们 将 提 一 下 其 中 比较 重要 的 于 字段 ， 
更 加 完整 的 讨论 请 参见 802. 11 规范 [Held 2001; Crow 1997; IEEE 802. 11 1999] 。 类 型 和 
子 类 型 字段 用 于 区 分 关联 、RTS、CTS、ACK 和 数据 帆 To (到 ) Al From (M) 字段 用 于 
定义 不 同 地 址 字段 的 含义 - (这 些 含 义 随 着 使 用 目 组 织 模式 或 者 基础 设施 模式 而 改变 ， 而 
且 在 使 用 基础 设施 模式 时 ， 也 随 着 是 无 线 站 点 还 是 AP 在 发 送 帧 而 变化 .) 最 后 ，WEP 字 
段 指示 了 是 否 使 用 加 密 (WEP 将 在 第 8 章 中 讨论 .) 


6. 3.4 在 相同 的 IP 子 网 中 的 移动 性 


为 了 增加 无 线 LAN 的 物理 范围 ， 公 司 或 大 学 经 第 会 在 同一 个 IP 子 网 中 部 署 多 个 BSS. 
这 目 然 就 引出 了 在 多 个 BSS 之 间 的 移动 性 问题 ， 即 无 线 站 点 如 何在 维持 进行 中 的 TCP 会 话 
的 情况 下 ， 无 颖 地 从 一 个 BSS 移动 到 为 一 个 BSS? 正如 我 们 将 在 本 小 市 中 所 见 ， 当 这 些 
BSS 属于 同一 子 网 时 ， 移 动 性 可 以 用 一 种 相对 直接 的 方式 解决 。 当 站 点 在 不 同 子 网 间 移 动 
时 ， 就 斋 要 更 为 复杂 的 移动 性 管理 协 以 卫 ， 我 们 将 在 6.5 A 6. © 市 中 学 习 这 些 协 议 ，。 

我 们 现在 看 一 个 同一 子 网 中 的 不 同 BSS 之 间 的 移动 性 的 特定 例子 。 图 6-15 显示 了 有 具 
有 一 台 主 机 HI 的 两 个 互联 的 BSS， 该 主机 从 BSS] 移动 到 BSS2。 因 为 在 这 个 例子 中 连接 
两 个 BSS 的 互联 设备 不 是 一 台 路 由 问 ， 故 在 两 个 交换 机 
BSS 中 的 所 有 站 点 (包括 AP) 都 属于 同一 个 IP j 
TR. RE, “44 HI 从 BSS] 移动 到 BSS2 AY, € 
可 以 保持 目 己 的 IP 地址 和 所 有 正在 进行 的 TCP 
连接 。 如 果 互 联 设备 是 一 台 路 由 部， 则 Hl 必须 
在 它 移动 进入 的 子 网 中 获得 一 个 新 地 址 。 这 种 地 
址 的 变化 将 打 断 (并且 最 终 终 止 ) 在 Hl 的 任何 
进行 中 的 TCP 连接 。 在 6.6 WP, 我们 将 能 看 到 
一 种 网 络 层 移动 性 协议 如 移动 下 能 被 用 于 避免 
该 问题 。 

但 是 H1 从 BSS] 移动 到 BSS2 时 有 具体 会 发 生 哪 些 事 呢 ” 随 着 Hl 逐步 远离 API, HI 检 
WARKA API 的 信号 逐渐 减弱 并 开始 扫描 一 个 更 强 的 信号 ，HI 收 到 来 自 AP2 的 信 标 帧 
(在 许多 公司 和 大 学 的 设置 中 它 与 API 有 相同 的 SSID). HI 然后 与 API 解除 关联 ， 并 与 
AP2 关联 起 来 ， 同 时 保持 其 IP 地 址 和 维持 正在 进行 的 TCP 会话。 

从 主机 和 AP 的 角度 ， 这 就 处 理 了 切换 问题 。 但 对 图 6-15 中 的 交换 机 又 会 发 生 什 么 样 
的 情况 呢 ? 交换 机 如 何 知道 主机 已 经 从 一 个 AP 移动 到 男 一 个 AP 呢 ? 回想 第 $ 章 所 述 ， 
交换 机 是 “ 目 学 习 ” 的 ， 并 且 自 动 构建 它们 的 转发 表 .。 这 种 上 自学 习 的 特征 很 好 地 处 理 了 偶 
尔 的 移动 〈( 例 如， 一 个 雇员 从 一 个 部 门 调转 到 另 一 个 部 门 ) 。 然 而 ， 交 换 机 没有 被 设计 用 
来 支持 用 户 在 不 同 BSS 间 高 度 移动 ， 同 时 又 希望 保持 TCP 连接 。 为 理解 这 一 问题 ， 回 想 在 
移动 之 前 ， 交 换 机 在 其 转发 表 中 有 一 个 表 项 ， 对 应 HI 的 MAC 地 址 与 到 达 H1 所 通过 的 出 
交换 机 疹 口 。 如 果 HI 初始 在 BSSI 中 ， 则 发 往 HI 的 数据 报 将 经 APL Se] HI, 然而 ， 一 
B H1 与 BSS2 关联 ， 它 的 帧 应 当 被 导向 AP2。 一 种 解决 方法 (BAAN) 是 在 新 的 
关联 形成 后 ， 让 AP2 以 Hl 的 源 地 址 向 交换 机 发 送 一 以 太 网 广播 帧 。 当 交换 机 收 到 该 帧 
后 ， 更 新 其 转发 表 ， 使 得 Hl 可 以 通过 AP2 BGA. 802. 11f 标准 小 组 正在 开发 一 个 AP HK 
协议 来 处 理 这 些 以 及 相关 的 问题 





图 6-15 同一 子 网 中 的 移动 性 
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6. 3.5 802. 11 中 的 高 级 特色 


我 们 将 简要 地 讨论 802. 11 网 络 中 具有 的 两 种 高 级 能 力 以 丰富 对 802. 11 的 讨论 内 容 。 
如 我 们 所 见 ， 这 些 能 力 并 不 是 完全 特定 于 802. 11 标准 的 ， 而 是 在 该 标准 中 可 能 由 特定 机 
制 产生 的 。 这 使 得 不 同 的 厂商 可 使 用 他 们 目 己 (专用 ) 的 方法 来 实现 这 些 能 力 ， 这 也 许 能 
LEi oak oe ft HE JI 

1. 802.11 速率 适应 

我 们 在 前 面 图 6-3 中 看 到 ， 不 同 的 调制 技术 (提供 了 不 同 的 传输 速率 ) 适合 于 不 同 的 
SNR 情况 .考虑 这 样 一 个 例子 ， 一 个 802. 11 用 户 最 初 离 基站 20 米 远 ， 这 里 信 噪 比 高 。 在 
此 高 信 品 比 的 情况 下 ， 该 用 户 能 够 与 基站 使 用 可 提供 高 传输 速率 的 物理 层 调制 技术 进行 通 
信 ， 同 时 维持 低 BER .这 个 用 户 多 么 冬 福 啊 ! 假定 该 用 户 开 始 移动 ， 回 离开 基站 的 方向 走 
去 ， 随 着 与 基站 距离 的 增加 ，SNR 一 直 在 下 降 .。 在 这 种 情况 下 ， 如 果 在 用 户 和 基站 之 间 运 
行 的 802. 11 协议 所 使 用 的 调制 技术 没有 改变 的 话 ， 随 着 SNR 减 小 ，BER 将 高 得 不 可 接 
Z., 最 终 ， 传 输 的 帧 将 不 能 正确 收 到 ; 

由 于 这 个 原因 ， 茶 些 802. 11 实现 具有 一 种 速率 目 适 应 能 力 ， 该 能 力 目 适 应 地 根据 当 
前 和 近期 信道 特点 来 选择 下 面 的 物理 层 调 制 技术 。 如 果 一 个 结 点 连续 发 送 两 个 帧 而 没有 收 
到 确认 (信道 上 一 个 比特 差错 的 隐 式 指示 )， 该 传输 速率 降低 到 前 一 个 较 低 的 速率 。 如 果 
10 个 帧 连续 得 到 确认 ， 或 如 果 用 来 跟踪 和 目 上 次 降 速 以 来 时 间 的 定时 器 超时 ， 该 传输 速率 
提高 到 上 一 个 较 融 的 速率 。 这 种 速率 适应 机 制 与 TCP 的 拥塞 控制 机 制 具有 相同 的 “探测 ” 
原理 ， 即 当 条 件 好 时 (反映 为 收 到 ACK), Se JT Fag GR AR, 除非 某 个 “坏事 ”发 生 了 
(ACK 没有 收 到 ) ; 当 某 个 “坏事 ”发 生 了 ， 减 小 传输 速率 。 因 此 ，802. 11 的 速率 适应 和 
TCP 的 拥塞 控制 类 似 于 年 幼 的 孩子 ， 他 们 不 断 地 疝 父 母 要 求 越 来 越 多 ( 如 幼儿 要 糖果 ， 青 
少年 要 求 推迟 睡觉 ) ， 和 直到 父母 亲 最 后 说 “ 够 1” ,孩子 们 不 再 要 求 了 ( 仅 当 以 后 情况 已 
经 变 好 了 才 会 再 次 尝试 )。 已 经 提出 了 一 些 其 他 方案 以 改善 这 个 基本 的 自动 速率 调整 方案 
| Kamerman 1997; Holland 2001; Lacage 2004 | . 

2. 功率 管理 

功率 是 移动 设备 的 宝贵 资源 ， 因 此 802. 11 标准 提供 了 功率 管理 能 力 ， 以 使 802. 11 结 
点 的 侦 听 、 传 输 和 接收 功能 以 及 其 他 再 要 “打开 ”电路 的 时 间 量 最 小 化 。802. 11 JRE 
理 按 下 列 方式 运行 。 一 个 结 点 能 够 明显 地 在 睡眠 和 唤醒 状态 之 间 交 和 蔡 ( 像 在 课堂 上 睡觉 的 
学 生 !) 。 通 过 将 802. 11 帧 首部 的 功率 管理 比特 设置 为 1， 茶 结 点 回 接 入 点 指示 它 将 打算 睡 
眠 。 设 置 结 点 中 的 一 个 定时 带 ， 使 得 正好 在 AP 计划 发 送 它 的 信 标 帧 前 唤醒 结 点 (前面 讲 
过 AP 通常 每 100ms 发 送 一 个 信 标 帧 ) 。 因 为 AP 从 设置 的 功率 传输 比特 知道 哪个 结 点 打算 
睡眠， 所 以 该 AP 知道 它 不 应 当 癌 这 个 结 点 发 送 任 何 帧 ， 先 缓存 目的 地 为 睡眠 主机 的 任何 
帧 ， 待 以 后 再 传输 ， 

在 AP 发 送信 标 帧 前 ， 怡 好 唤醒 结 点 ， 并 迅速 进入 全 面 活动 状态 (与 睡觉 的 学 生 不 
同 ， 这 种 唤醒 仅 需 要 250ps| Kamerman 1997j!) 。 由 AP 发 送 的 信 标 帧 包含 了 帧 被 缓存 在 
AP 中 的 绪 点 的 列表 。 如 果 采 编 点 没有 缓存 的 帧 ， 它 能 够 返回 睡眠 状态 。 和 否则 ， 该 结 点 能 
He at fm] AP 发 送 一 个 探 询 报 文 明确 地 请 求 发 送 缓存 的 帧 。 对 于 信 标 之 间 的 100ms 时 间 来 
说 ，250hs 的 唤醒 时 间 以 及 类 似 的 接收 信 标 帆 及 检查 以 确保 不 存在 缓存 帧 的 短小 时 间 ， 没 
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有 帧 要 发 送 和 接收 的 结 点 能 够 睡眠 99% 的 时 间 ， 从 而 大 大 节省 了 能 源 
6.3.6 802.11 以 外 的 标准 : 蓝牙 和 ZigBee 


如 攻 6-2 所 示 ，IEEE 802. 11 WiFi 标准 主要 针对 相距 多 达 100m 的 设备 加 的 通信 ( 
使 用 802. 11 具有 定向 天 线 的 点 对 点 配置 时 除外 )。 两 个 其 他 的 IEPE 802 协议 一 一 蓝牙 
ZigBee (定义 在 IEEE 802. 15. 1 和 IEEE 802. 15.4 标准 中 [IEEE 802.15 2012]), LAR 
WiMAX (GE X {E IEEE 802. 16 标准 中 [IEEE 802. 16d 2004; IEEE 802. 16e 2005 上) ， 它 们 
分 别 是 用 于 短 忠 离 和 长 距离 通信 的 标准 ,， 当 我 们 在 6.4 节 中 讨论 蜂 需 数据 网 络 时 ， 将 向 要 
接触 WiMAX ， 因 此 这 里 将 关注 用 于 短 距 离 通信 的 网 络 。 

1. 蓝牙 

IEEE 802. 15.1 网 络 以 小 范围 、 低 功率 和 低 成 本 运行 . EAS EARJE, bv 
低速 率 的 “电缆 蔡 代 ”技术 ， ey 串 行 设备 、 蜂 坑 电 话 和 智能 手机 ， 而 802. 11 
是 一 个 大 功率 、 中 等 范围 、 高 速 “ 接 人 ”技术 。 为 此 ，802. 15. 1 网 络 有 时 被 称 为 无 线 个 
人 区 域 网 络 (Wireless Personal ns ae WPAN) 标准 。802. 15.1 的 链 路 层 和 物理 层 基 
于 早期 用 于 个 人 区 域 网 络 的 蓝牙 (Bluetooth) 规范 | Held 2001, Bisdikian 2001 |. 802. 15. 1 
网 络 以 TDNM 方式 工作 于 无 需 许 可 证 的 2.4GHz 无 线 电 波段 ， 每 个 时 陈 长 度 为 62$Sus， 在 每 个 
时 际 内 ， 发 送 方 利用 79 个 信道 中 的 一 个 进行 传输 ， 同 时 从 时 际 到 时 际 以 一 个 已 知 的 伪 随 
机 方式 变更 信道 。 这 种 被 称 作 跳 频 扩 展 频 谱 ( Frequency- Hopping Spread Spectrum, FHSS) 
的 信道 跳动 的 形式 将 传输 及 时 扩展 到 整个 频谱 ，802. 15. 1 AEH WO 的 数据 对 

802. 15.1 网 络 是 自 组 织 网 络 : 不 而 要 网 络 基础 设施 (如 一 个 接 人 点 ) 来 互 连 
802. 15. 1 设备 ， 因 此 ，802. 15. 1 设备 必须 日 己 进行 组 织 。802. 15. 1 TETIS 
et 个 活动 设备 的 皮 可 网 (piconet), Ql 6-16 所 示 。 这 些 设备 之 一 被 指定 为 主 设备 ， 

其 余 充当 从 设备 。 主 结 点 真正 控制 皮 可 网 ， 即 它 的 时 钟 确定 了 皮 可 网 中 的 时 间 ， 它 可 以 在 
每 个 奇数 时 阶 PRIS, 而 从 设备 仅 当主 设 
备 在 前 一 时 院 与 其 通信 后 才 可 以 发 送 ， 并 
且 只 能 发 送 给 主 设 备 。 除 了 从 设备 ， 网 络 
中 还 可 的 有 多 达 255 个 的 寄 放 (parked) 
设备 。 这 些 设 备 仪 当 其 状态 被 主 结 点 从 宁 
放 转 换 为 活动 之 后 才 可 以 进行 通信 。 

希望 了 解 更 多 有 关 802. 15. 1WPAN {ñ 
息 的 读者 可 以 查阅 蓝牙 参考 资料 | Held 
2001, Bisdikian 2001], 8%? IEEE 802. 15 





Baa 


Web 网 站 [IEEE 802. 15 2012]. 

2. ZigBee 图 6-16 蓝牙 皮 可 网 

IEEE 的 第 二 个 个 人 区 域 网 络 标准 是 802. 14.5 [IEEE 802. 15 2012 ] ， 它 被 称 为 ZigBee. 
虽然 蓝牙 网 络 提供 了 一 种 “电缆 替代 ”的 超过 每 秒 兆 比 特 的 数据 率 ， 但 ZigBee FZ iF 


仍 是 以 低 功 率 、 低 数据 率 、 低 工作 周期 应 用 为 目标 。 尽 管 我 们 可 能 倾 回 于 认为 “更 大 和 中 
快 就 更 好 ”， 但 是 并 非 所 有 的 网 络 应 用 都 需要 高 带宽 和 随 之 而 来 的 高 成 本 (经 济 和 功率 方 
面 ) 。 人 例如， 家庭 温度 和 光线 传感器 、 安 全 设备 和 墙 上 安装 的 开关 部 是 非常 简单 、 低 功率 、 
低 工作 周期 、 低 成 本 设备 。ZigBee 因此 是 非常 适合 于 这 些 设备 的 。ZigBee 定义 20kbps、 
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40kbps, 100kbps 和 250kbps 的 信道 速率 ， 这 取决 于 信道 的 频率 。 

ZigBee 网 络 中 的 结 点 具有 两 个 特色 。 多 个 所 谓 “ 简 化 功能 设备 ”在 单个 “全 功能 设备 ” 
控制 下 作为 从 设备 运行 ， 与 蓝牙 从 设备 非常 相似 。 一 个 全 功能 设备 能 够 作为 一 个 主 设备 运行 ， 
就 像 在 监 牙 中 控制 多 个 从 设备 那样 ， 并 且 多 个 全 功能 设备 还 能 够 配置 为 一 个 网 状 (mesh) 网 
络 ， 其 中 全 功能 设备 在 它们 之 间 发 送 帧 ，ZigBee 可 以 共享 许多 我 们 已 经 在 其 他 链 路 层 协议 中 遇 
到 的 协议 机 制 : 信 标 帧 和 链 路 层 确 认 〈 类 似 于 802. 11 ) ， 有 具有 二 进 制 回 退 的 载波 侦 听 随机 访问 
协议 〈 类 似 于 802. 11 和 以 太 网 )， 以 及 时 际 的 固定 、 确 保 的 分 配 (类 似 于 DOCSIS ) 。 

ZigBee 网 络 能 够 配置 为 许多 不 同 的 方式 。 我 们 考虑 一 种 简单 的 场合 ， 其 中 单一 的 全 功 
能 设备 使 用 信 标 帧 以 一 种 时 际 方式 控制 多 个 简化 功能 设备 。 图 6-17 显示 了 这 种 情况 ， 其 
中 ZigBee 网 络 将 时 间 划 分 为 反复 出 现 的 超 帧 ， 每 个 超 帧 以 一 个 信 标 帆 开 始 。 每 个 信 标 帧 将 
超 帧 划分 为 一 个 活跃 周期 (在 这 个 周期 内 设备 可 以 传输 ) 和 一 个 非 活 路 周期 (在 这 个 周 
期 内 所 有 设备 包括 控制 器 能 够 睡眠 进而 保存 能 量 ) 。 活 跃 周期 由 16 个 时 际 组 成 ， 其 中 一 些 
由 采用 CSMA/CA 随机 接 入 方式 的 设备 使 用 ， 其 中 一 些 由 控制 各 分 配给 特定 的 设备 ， 因 而 
为 那些 设备 提供 了 确保 的 信道 。 有关 ZigBee 网 络 的 更 多 细 市 能 够 在 | Baronti 2007, IEEE 
802. 15. 4 2012] 中 找到 ， 
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图 6-17 ZigBee 802. 14. 4 超 帧 结构 


6.4 蜂窝 因特网 接 入 


在 前 一 节 中 ， 我 们 考察 了 一 台 因 特 网 主机 当 位 于 WiFi 热 区 中 时 ， 即 当 它 位 于 一 个 


802. 11 接 入 点 附近 时 ， 是 如 何 接 入 因特网 的 。 然 而 大 多 数 WiFi 热 区 只 有 一 个 直径 为 10 ~ 
100m 的 小 规模 覆盖 范围 。 当 我 们 十 分 需要 无 线 因 特 网 接 入 但 同时 又 无 法 访问 WiFi 热 区 
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网 络 ， 使 它们 不 仅 支 持 语 音 电 话 ， 同 时 也 支持 无 线 因特网 接 入 。 理 想 情 况 下 ， 这 种 因特网 接 
人 将 会 有 相当 高 的 速率 ， 并且 可 以 提供 无 颖 的 移动 性 ， 允 许 用 户 在 旅行 过 程 中 ( 如 在 汽车 或 
火车 上 ) 保持 其 TCP 会话。 使 用 足够 高 的 上 行 和 下 行 比特 速率 ， 用 户 甚至 可 以 在 移动 中 维持 
视频 会 议 。 这 种 情况 并 非 遥 不 可 及 。 在 2012 年 ， 美 国 的 许多 蜂窝 电话 提供 疝 以 低 于 50 美元 / 
月 的 价格 ， 为 用 户 提供 数 百 kbps 的 上 行 和 下 行 比 速率 的 蜂 窜 因特网 接 入 。 随 着 那些 我 们 将 
在 这 里 涉及 的 宽带 数据 服务 的 更 广泛 部 署 ， 每 秒 几 兆 比特 的 数据 速率 正 变 得 可 行 。 

在 本 节 中 ， 我 们 对 当前 和 即将 出 现 的 蜂窝 因特网 接 入 技术 进行 简要 概述 。 我 们 这 里 仍 
然 重 点 关注 无 线 第 一 跳 以 及 将 无 线 第 一 跳 连接 进 更 大 的 电话 网 和 因特网 的 网 络 ; 在 6.7 市 
中 ， 我 们 将 考虑 如 何 把 呼叫 路 由 选 搓 到 在 不 同 基站 间 移 动 的 用 户 。 我 们 的 简要 讨论 只 是 对 
蜂窝 技术 进行 一 个 简单 、 宏 观 描 述 。 当 然 ， 现 代 蜂 窝 通信 有 更 大 的 广度 和 深度 ， 有 许多 大 
学 提供 关于 这 一 主题 的 许多 课程 。 希望 对 此 做 更 深入 了 解 的 读者 可 参阅 | Goodman 1997; 
Kaaranen 2001; Lin 2001; Korhonen 2003; Schiller 2003; Scourias 2012; Turner 2012; 
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Akyildiz 2010 | ， 以 及 特别 优秀 和 详尽 的 参考 资料 [Mouly 1992 ] 。 


历史 事件 


3G 蜂窝 移动 与 无 线 LAN 的 比较 

许多 蜂 入 移动 电话 的 运营 者 正在 部 团 3G 蜂 贡 移动 系统 ， 它 的 户 内 数据 速率 为 
2Mbps， 户 外 数据 速率 为 384kbps， 或 者 速率 更 锅 。 这些 3G 系统 部 署 在 需要 许可 证 的 无 
RMP, 运营 者 向 政府 支付 可 观 的 费用 来 获得 使 用 频谱 的 许可 证 . 3G 系统 以 一 种 与 
现在 蜂 祖 电话 相似 的 接 入 方式 ， 允 许 用 户 在 活动 中 从 遂 远 的 户外 接 入 因特网 。 例如，3C 
技术 允许 用 户 在 开车 的 时 候 访问 行车 地 图 信息 ， 或 者 在 海滩 进行 日 光 浴 时 访问 电影 院 的 
信息 。 无 论 如 何 ， 考 虑 到 3G 的 费用 和 用 户 经 党 同 时 接 入 无 线 LAN fo 3G 的 事实 ， 人 们 
可 能 会 质疑 3G 系统 使 用 的 程度 : 

o 新 兴 的 无 线 LAN 基础 设施 将 可 能 变 得 几乎 无 所 不 在 。 工作 于 54Mbps 的 IEEE 
802.11 无 线 LAN 已 经 得 到 了 广泛 部 署 。 几 乎 所 有 便携 计算 机 和 智能 手机 出 厂 时 
都 配 有 802.11 LAN 的 能 力 . mE, 新兴 的 因特网 装置 (例如 无 线 照相 机 和 相 
框 ) 也 县 有 体积 小 、 功 率 低 的 无 线 LAN 能 力 

© 无 线 LAN 的 基站 也 能 处 理 移动 电话 装置 。 许 多 电话 已 经 能 够 直接 或 使 用 类 Skype IP 
语音 与 蜂 帘 电话 网 络 或 P 网 络 连接 ， 因 此 绕 过 运营 者 的 蜂窝 语音 和 3G 数据 服务 . 

当然 ， 许 多 其 他 的 专家 相信 36G 不 仅 将 取得 巨大 的 成 功 ， 而 且 也 将 使 我 们 工作 和 生 

活 的 方式 发 生 引 人 注目 的 革命 。WiFi 和 3G 很 可 能 都 会 成 为 流行 的 无 线 技术 ， 让 漫游 无 
线 设备 自动 选择 在 其 当前 所 处 物理 位 置 提供 最 好 服务 的 接 入 技术 . 


6.4.1 蜂窝 网 体系 结构 概述 


在 本 敢 描述 蜂窝 网 体系 结构 时 ， 我 们 将 采用 全 球 移动 通信 系统 (GSM) 标准 的 术语 。 从 
ARNE A, Ae ESAS i] GSM 源 于 术语 “Groupe Spécial Mobile”， 后 来 才 采 用 了 更 为 英 
文化 的 名 字 ， 不 过 这 使 最 初 的 首 字 共 缩写 词 得 以 保留 .到 了 20 世纪 80 年 代 ， 欧 洲 人 认识 到 
需要 一 个 省 欧洲 的 数字 蜂 祖 电话 系统 ， 以 代 蔡 多 个 不 兼容 的 模拟 蜂 帘 电 话 系 统 ， 从 而 导致 了 
GSM 标准 的 出 现 | Mouly 1992 |。 欧 洲 人 在 20 世纪 90 年 代 初 就 成 功 地 部 署 了 了 GSM 技术, A 
此 后 GSM 成 长 为 移动 电话 领域 的 庞然大物 ， 全 世界 有 超过 80% 以 上 的 蜂窝 用 户 使 用 GSM, 

当 人 们 谈论 蜂窝 技术 时 ， 他 们 经 常 将 该 技术 分 类 为 几 “ 代 ”之 一 。 最 早 一 代 的 设计 主 
要 用 于 语音 通信 。 第 一 代 (1G) 系统 是 模拟 FDMA 系统 ， 其 专门 用 于 语音 通信 。 这 些 1G 
系统 目前 几乎 绝迹 ， 它们 被 数字 2G 系统 所 蔡 At. 初始 的 26 系统 也 是 为 语音 而 设计 ， 但 
后 来 除了 语音 服务 外 还 扩展 了 对 数据 ( 即 因特网 ) 的 支持 (2.5G)。 当前 正在 部 署 的 3C 
系统 也 支持 语音 和 数据 ， 但 越 来 越 剖 调 其 数据 能 力 和 更 高 速 的 无 线 接 入 链 路 . 

2G 蜂 冤 网 体系 结构 : 与 电话 网 的 语音 连接 

RRES (cellular) 是 指 这 样 的 事实 ， 即 由 一 个 蜂 需 网 履 盖 的 区 域 被 分 成 许多 称 作 小 
区 (cell) 的 地 理 矫 盖 区 域 ， 小 区 如 图 6-18 左 侧 的 六 边 形 所 示 。 如 同 在 6.3. 1 节 中 学 习 的 
802. 11 WiFi 标准 一 样 ，GSM 有 上 月 己 的 特殊 命名 法 - 每 个 小 区 包含 一 个 收发 基站 (Base 
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Transceiver Station，BTS) ， 负 责 回 位 于 其 小 区 内 的 移动 站 点 发 送 或 接收 信号 。 一 个 小 区 的 
禾 盖 区 域 取决 于 许多 因素 ， 包 括 BTS 的 发 射 功率 、 用 户 设备 的 传输 功率 、 小 区 中 的 障碍 建 
筑 物 以 及 基站 天 线 的 高 度 。 尽管 图 6-18 中 显示 的 是 每 个 小 区 包含 一 个 位 于 该 小 区 中 间 的 
收发 基站 ， 但 今天 的 许多 系统 将 BTS 放置 在 3 个 小 区 的 交叉 处 ， 使 得 具有 有 了 回 天 线 的 单个 
BTS 能 够 为 三 个 小 区 提供 服务 ， 
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图 6-18 GSM 2G 蜂 帘 网 体系 结构 的 组 件 


2G 蜂窝 系统 的 GSM 标准 对 空中 接口 使 用 了 组 合 的 FDMZTDM (无 线 ,第 1 草 中 讲 
过 ， 使 用 纯 FPDPM， 信 道 被 划分 成 许多 频段 ， 每 个 呼叫 分 配 一 个 频段 ， 章 也 讲 过 ， 使 有 Játi 
TDM, Hla peo AW, BEA A BE AP AR, BEE 1 OS nt 中 被 分 配 使 用 
特定 的 时 际 。 在 组 合 的 FDMATDM 系统 中 ， 信 道 被 划分 为 在 十 频率 子 市 ; 对 于 每 个 子 市， 时 
间 又 被 划分 为 帧 和 时 际 。 因 此 ， 对 于 一 个 组 合 的 FTDMATDM 系统 ， 如 宋 信 道 被 划分 为 
带 ， 并 且 时 间 被 划分 为 了 个 时 际 ， 那 么 该 信道 将 能 够 文 持 严 :了 个 并 发 的 呼叫 。 我 们 在 5. 

本 中 看 到 ， 电 缆 接 和 人 网 也 使 用 了 组 合 的 FDMZTDNM 方法 。GSM 系统 由 多 个 200kHz 的 频 im 
成 ， 每 个 频带 支持 8 个 TDM IEI., GSM 以 13kbps Al 12. 2kbps 的 速率 编 伍 。 

一 个 GSM 网 络 的 基站 控制 器 (Base Station Controller, BSC) iÑ% IRI FUL + PI 
基站 。BSC 的 责任 是 为 移动 用 户 分 配 BTS 无 线 信道 ， 执 行 寻 呼 (paging) ( 找 出 示 移 动用 
户 所 在 的 小 区 ) ， 执 行 移动 用 户 的 切换 (切换 是 我 们 将 在 6.7.2 节 中 涉及 的 主题 ) 。 基 站 控 
制 融 及 其 控制 的 收发 基站 共同 构成 卫 GSM 基站 系统 (Base Station System, BSS), 

我 们 将 在 6.7 节 中 看 到 ， 在 用 户 鉴别 和 账户 管理 (决定 是 否 允许 某 个 移动 设备 与 蜂窝 
网 络 连 接 ) 以 及 呼叫 建立 和 切换 中 ， 移 动 交换 中 心 (Mobile sWitching Center, MSC) 起 看 
决定 性 的 作用 。 单 个 MSC 通常 将 包含 多 达 5 个 BSC， 因 此 每 个 MSC 有 大 约 200 000 个 用 
户 。 一 个 蜂 窟 提供 商 的 网 络 将 有 若干 MSC， 使 用 称 为 网 天 MSC 的 特殊 MSC 将 提供 商 的 蜂 
坑 网 络 与 更 大 的 公共 电话 网 相连 。 


6.4.2 3G 蜂窝 数据 网 : 将 因特网 扩展 到 蜂窝 用 户 
我 们 在 6. 4. 1 节 中 的 讨论 关注 了 蜂窝 语音 用 户 连 接 到 公共 电话 网 。 当 然 ， 当 我 们 开始 
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这 样 干 时 ， 也 乐意 读 电 子 邮 件 、 访 问 Web 、 获 取 位 置 相关 的 服务 Mint KAMEEL), 
或 许 甚至 观看 流 式 视频 。 为 此 ,我 们 的 欠 能 手机 需要 运行 完整 的 TCPVZIP 协议 栈 (包括 物 
理 层 、 链 路 层 、 网 络 层 、 运 输 层 和 应 用 层 )， 并 能 够 经 过 蜂 坑 网 与 因特网 连接 。 随 着 一 代 
(和 半 代 ) 继 生 一 代 ， 以 及 引入 许多 具有 新 首 字 母 缩 上 略 词 的 新 搁 术 和 服务 ， 蜂 簧 数据 网 的 
主题 也 就 是 讨论 一 系列 相互 范 争 和 不 断 演 化 的 标准 ， 这 个 标准 集合 相当 令 人 迷惑 。 更 糟糕 
的 是 ， 没 有 单一 的 官方 机 构 对 2.5G、3G、3.5G 或 4G 技术 设立 要 求 ， 难 以 理 清 这 些 范 争 
性 标准 之 间 的 差异 。 在 我 们 下 面 的 讨论 中 ， 我 们 将 关注 由 第 三 代 合 作 伙 伴 项 目 (3rd Gen- 
eration Partnership Project, 3GPP) 侠 发 的 通用 移动 通信 服务 (Universal Mobile Telecommu- 
nications Service, UMTS) 3G 标准 [3GPP 2012], UMTS 是 一 种 广泛 部 署 的 3G 技术 。 
我 们 自 上 而 下 地 查看 一 下 显示 在 图 6-19 中 的 3G 蜂 帘 数 据 网 体系 结构 ，。 
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图 6-19 3G 系统 体系 结构 


1. 3G 核心 网 

3G 核心 蜂 视 数据 网 将 无 线 电 接 入 网 连接 到 公共 因特网 。 核 心 网 与 我 们 前 面 在 图 6-18 
中 遇 到 过 的 现 有 蜂 寅 语音 网 (特别 是 MSC) 的 组 件 协作 。 由 于 在 现 有 的 蜂窝 语音 网 中 有 具 
有 大 量 的 现 有 基础 设施 (有 利 可 图 的 服务 !) ，36G 的 设计 者 们 所 采取 的 方法 非常 清楚 : 不 
去 触动 现 有 核心 CSM 蜂窝 语音 网 ， 增 加 与 现 有 蜂 帘 语 音 网 平行 的 附加 蜂 窜 数据 功 能 。 如 
果 将 新 的 数据 服务 直接 增加 到 现 有 的 蜂 需 语音 网 上 ， 这 种 方法 同样 会 引发 4.4.4 市 中 过 到 
的 挑战 一 一 在 前 面 我 们 讨论 了 在 因特网 中 综合 新 的 (IPv6) 和 遗产 (IPv4) 技术 。 
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在 36 核心 网 中 有 两 类 结 点 : 服务 通用 分 组 无 线 服 务 支 持 结 点 (Serving Generalized 
packet radio service Support Node, SGSN) 和 网 关 GPRS 支持 结 点 (Gateway GPRS Support 
Node, GGSN). (GPRS (General Packet Radio Service) 表示 通用 分 组 无 线 服务 ， 这 是 一 种 
在 2G 网 络 中 的 早期 蜂 帘 数据 服务 ; 这 里 我 们 讨论 的 是 在 3G 网 络 中 的 GPRS 的 演化 版 本 - ) 
一 个 SGSN 负责 向 位 于 其 连接 的 无 线 电 接 人 网 中 的 移动 结 点 交付 (或 从 移动 结 点 获取 ) 数 
Hid. SGSN 与 该 区 域 蜂 帘 语音 网 的 MSC 进行 交互 ， 提 供用 户 认 证 和 切换 ， 维 护 活 跃 移动 
结 点 的 位 置 (小 区 ) 信息 ， 执 行 位 于 无 线 接 人 网 中 的 移动 结 点 和 GGSN 之 间 的 数据 报 转 
Ke. GGSN 起 到 网 关 作 用 ， 将 多 个 SGSN 连接 到 更 大 的 因特网 。GGSN 因此 是 源 于 移动 结 点 
的 一 个 数据 报 在 进入 更 大 因特网 之 前 遇 到 的 3G 基础 设施 的 最 后 一 部 分 。 

2. 3G KIIZA W: 无 线 边 缘 

3G 无 线 电 接 入 网 (radio access network) 是 我 们 作为 3G 用 户 看 见 的 无 线 第 一 跳 网 络 
无 线 电 网 络 控制 器 (Radio Network Controller, RNC) 通 第 控制 几 个 小 区 的 收发 其 站， 类 似 
于 我 们 在 2G 网 络 中 遇 到 的 基站 (但 是 3G UMTS 的 正式 用 语 称 为 一 个 “ 结 点 Bx， 这 是 一 
个 相当 不 具 描 述 性 名 字 !),， 每 个 小 区 的 无 线 链 路 运行 在 移动 结 和 点 和 收发 基站 之 间 ， 就 像 在 
2G 网 络 中 那样 。RNC 既 通 过 MSC 与 电路 交换 蜂 贷 语音 网 连接 ， 又 通过 SGSN 与 分 组 交换 
的 因特网 连接 。 因此 ,尽管 3G 蜂 入 语 音 服 务 和 蜂 夫 数据 服务 使 用 不 同 的 核心 网 ， 但 它们 
共享 一 个 相同 的 第 一 /最 后 一 跳 无 线 电 接 入 网 。 

较 之 2G 网 络 ， 在 3G UMTS 中 的 一 个 重大 变化 是 不 再 使 用 GSM 的 FDMA/TDMA 方案 ， 
UMTS 在 TDMA 时 院 中 使 用 称 为 直接 序列 宽带 CDMA (Direct Sequence Wideband CDMA, 
DS- WCDMA) 的 CDMA 技术 [| Dahlman 1998]。TDMA 时 际 又 在 多 个 频率 上 可 供 使 用 ， 即 
有 趣 地 使 用 了 我 们 在 前 面 第 5 草 指 出 的 全 部 三 种 不 同 的 信道 共享 方法 ， 并 且 类 似 于 有 线 电 
缆 接 人 网 中 所 采用 的 方法 (参见 $.3.4 节 )。 这 种 变化 要 求 一 个 新 的 3G 蜂 窜 无线 接 入 网 与 
显示 在 图 6-19 中 的 2C BSS 无线电 网 络 并 行 运 行 、 与 WCDMA 规范 相关 的 数据 服务 被 称 为 
高 速 分 组 接 入 (High Speed Packet Access, HSPA), ， 其 下行 数据 传输 率 有 望 高 达 14Mbps. 
有 关 36G 网 络 的 细节 能 够 在 3GPP Web 站 点 上 找到 [3GPP 2012]. 


6. 4.3 走向 4G: LTE 


随 着 现在 3G 系统 的 全 球 部 署 ，4G 系统 的 到 来 还 远 吗 ?当然 不 会 ! 4G 系统 的 设计 、 

时 期 测试 和 初始 部 署 的 确 已 经 在 进行 中 了 。 由 3GPP 提出 的 4G 长 期 演化 (4G Long-Term 
Evolution, LTE) 标准 ， 与 3G 相 比 有 两 项 重要 创新 : 

© 演化 的 分 组 核 (Evolved Packet Core, EPC) [3GPP Nework Architecture 2012 | . 

EPC 是 一 个 简化 的 全 IP ORNA, PI 2 oP S AY B 3 RR gE PY Fj |] 6-19 

中 显示 的 分 组 交换 蜂 汉 数据 网 统一 起 来 。 它 是 一 个 “全 IP” 网 络 ， 是 指 语音 和 数 

据 将 在 IP 数据 报 中 承载。 如 我 们 在 第 4 草 中 已 经 看 到 和 将 在 第 7 草 中 更 为 详细 地 

学 习 的 那样 ，IP 的 “尽力 而 为 ”服务 模型 本 质 上 并 不 非常 适合 IP 语音 ( VolP) 

流量 的 严格 的 性 能 要 求 ， 除 非 精 心 管理 网 络 资源 避免 (并 非 作 出 反应 ) WE., N 

He, EPC 的 关键 任务 是 管理 网 络 资源 以 提供 这 种 高 质量 的 服务 . EPC 也 对 网 络 控 

制 和 用 户 数据 平面 做 出 了 了 明确 划分 ， 因 为 我 们 将 在 6.7 节 中 学 习 的 许多 移动 性 文 

持 功 能 将 在 控制 平面 中 实现 。EPC 允许 多 种 类 型 的 无 线 电 接 入 网 (包括 遗留 的 2C 

和 3G 无 线 电 接 入 网 ) 与 核心 网 连接 。 对 EPC 的 两 个 可 读 性 很 强 的 概述 见 
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| Motorola 2007; Alcatel- Lucent 2009 | 


e LTE 无 线 电 接 入 网 (LTE Radio Access Network). LTE 在 下 行 信 站 采用 频 分 复 用 和 


时 分 复 用 结合 的 方法 ， 称 之 为 正 交 频 分 复 用 (Orthogonal Frequency Division Multi- 
plexing, OFDM) 技术 | Rohde 2008; Ericsson 2011 |] ，(“ 正 交 ” 一 词 来 源 于 如 下 
事实 ， 所 生成 的 在 不 同 频道 上 发 送 的 信号 ， 它 们 相互 干扰 非常 小 ， 即 使 当 信 道 频 
率 紧密 排列 时 ) o E LTE 中 ， 每 个 活跃 的 移动 结 点 都 可 以 在 一 个 或 更 多 个 信道 频 
率 上 被 分 配 一 个 或 更 多 个 0. Sms AYP, BI 6-20 显示 了 在 4 个 频率 上 分 配 8 个 时 际 
的 情况 。 通 过 分 配 越 来 越 多 的 时 际 (无 论 是 用 相同 的 频率 还 是 用 不 同 的 频率 ) ， 移 
动 结 点 能 够 获取 越 来 越 高 的 传输 速率 ， 在 移动 结 点 之 间 进 行 时 际 CE) 分 配 的 频 
度 为 每 毫秒 一 次 。 不 同 的 调制 方案 也 能 被 用 于 改变 传输 速率 ; 参见 我 们 前 面 对 和 图 
6-3 的 讨论 以 及 Wiki 网 络 中 调制 方案 的 动态 选择 。LTE 无 线 电网 络 中 的 另 一 项 创 
新 是 使 用 复杂 的 多 输入 多 输出 (MIMO) Rék. {EH 20MHz 无 线 频谱 时 ， 一 个 
LTE 用 户 的 最 大 数据 率 能 够 达到 下 行 方向 100Mbps 和 上 行 方 向 50Mbps. 





9.0 9:5 10.0 


图 6-20 在 每 个 频率 上 ，20 40. Sms YN BEAL 10ms 帧 ， 阴 影 显示 了 一 个 8 个 时 际 分 配 


LTE 标准 并 未 对 移动 结 点 的 时 院 特 殊 分 配 进行 踢 制 要 求 。 相 反 ， 人 允许 哪个 移动 结 点 在 
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某 个 给 定 的 时 隙 在 给 定 的 频率 下 传输 ， 这 个 决定 由 LTE 设备 商 和 /或 网 络 运营 商 提供 的 调 
度 算法 来 做 出 。 使 用 机 会 调度 | Bender 2000; Kolding 2003; Kulkarni 2005 ] ， 将 物理 层 协 
议 与 发 送 方 和 接收 方 之 间 的 信道 条 件 相 匹 配 ， 基 于 信道 条 件 选择 分 组 将 发 往 的 接收 方 ， 使 
无 线 电网 络 控制 器 能 够 最 大 限度 地 利用 无 线 媒体 此外， 用 户 优先 权 和 服务 的 契约 等 级 
(如 银 、 
的 LTE 通过 分 配 聚 合 信道 给 移动 结 点 允许 数 百 兆 下 行 审 宽 | Akyildiz 2010 |. 

一 种 AG 无 线 技术 是 WiMAX (全球 微 波 接 入 互 操作 )， 它 是 一 个 IEEE 802. 16 标准 
Hite, 45 LTE 有 着 重大 差异 。 究 竞 是 LTE 还 是 WIMAX 将 成 为 4G 技术 的 选择 仍然 有 竺 
观察 ， 但 是 在 本 书写 作 的 时 候 (2012 年 春 ) LTE 看 起 来 具有 更 强劲 的 动力 ，WiMAX 的 
详细 讨论 能 够 在 本 书 的 Web 站 点 上 找到 。 


6.5 移动 管理 : 原理 


金 或 铂金 ) 能 够 在 下 行 分 组 传输 的 调度 中 使 用 。 除 上面 描述 的 LTE HEJ, K 


学 习 了 无 线 网 络 中 通信 和 链 路 的 无 线 特性 后 ， 现 在 我 们 转向 这 些 无 线 链 路 带 来 的 移动 性 ， 
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沉 泛 地 讲 ， 移 动 结 点 是 随时 间 改 变 它 与 网 络 连 接 位 置 的 结 点 。 因 为 移动 性 这 一 术语 在 计算 机 
和 电话 界 有 许多 含义 ， 所 以 先 更 为 详细 地 讨论 一 下 移动 性 的 各 个 方面 将 对 我 们 很 有 带 助 。 
e 从 网 络 层 的 角度 看 ， 用 户 如 何 移动 ? 一 个 物理 上 移动 的 用 户 将 对 网 络 层 提 出 一 系 
列 不 同 寻常 的 挑战 ， 这 取决 于 他 (她 ) 在 网 络 连接 点 之 间 如 何 移动 。 在 网 6-21 中 
的 移动 程度 谱 的 一 端 ， 用 户 也 许 带 着 一 台 装 有 无 线 网 络 接口 卡 的 便携 机 在 一 座 建 
筑 物 内 走动 。 如 我 们 在 6.3.4 节 中 所 见 ， 从 网 络 层 的 角度 来 看 ， 该 用 户 并 没有 移 
动 。 而 且 ， 如 果 该 用 户 不 论 在 何 处 都 与 同一 个 接 人 点 相关 联 ， 从 链 路 层 角 度 来 看 
该 用 户 甚至 也 没有 移动 。 
在 该 移动 程度 谱 的 另 一 端 ， 考 虑 一 下 该 用 户 在 一 辆 “宝马 ” 轿 梧 内 以 150km/h 
的 时 速 沿 高 速 公路 急速 行驶 时 穿 过 多 个 无 线 接 人 网 ， 并 和 布 望 在 整个 旅程 中 保持 一 
个 与 远程 应 用 的 不 间断 的 TCP 连接 。 这 个 用 户 无 疑 是 移动 的 ! 在 这 两 种 极 病 之 间 
的 情况 是 ， 一 个 用 户 带 着 一 台 便 携 机 从 一 个 地 方 ( 如 办 公 室 或 答 人 省 ) 到 为 一 个 地 
方 ( 如 咖啡 店 、 教 室 )， 并且 想 在 新 地 方 连 入 网 络 。 该 用 户 也 是 移动 的 (虽然 比 
“宝马 ”驾驶 员 的 移动 性 差 一 些 !1)， 只 不 过 不 需要 在 网 络 接 入 点 之 间 移 动 时 维持 
一 个 不 间断 的 连接 。 图 6-21 从 网 络 层 角度 阐明 了 用 户 移动 性 的 程度 谱 。 
无 移动 性 高 移动 性 





用 户 仅 在 相同 用 户 在 接 入 网 之 间 用 户 在 接 入 网 


的 无 线 接 入 网 中 移动 ， 当 在 网 间 移 动 之 间 移 动 ， 同 时 
移动 时 关闭 连接 维持 进行 的 连接 


图 6-21 从 网 络 层 观点 来 看 各 种 程度 的 移动 性 


e 移动 结 点 的 地 址 始终 保持 不 变 有 多 么 重要 ? 对 移动 电话 而 言 ， 当 你 从 一 个 提供 商 移 
动 电话 网 络 到 另 一 个 的 过 程 中 ， 你 的 电话 号 码 (本 质 上 是 你 电话 的 网 络 层 地 址 ) 始 
终 保 持 不 变 。 类 似 地 ， 便 携 机 在 IP 网 络 之 间 移 动 时 是 否 也 必须 维持 相同 的 IP 地 址 呢 ? 

对 这 一 问题 的 回答 很 大 程度 上 取决 于 所 运行 的 应 用 程序 。 对 于 那个 在 高 速 公 
路 上 飞驰 ， 同 时 又 希望 维持 对 一 个 远程 应 用 的 不 间断 的 TCP 连接 的 宝马 司机 而 言 ， 
维持 相同 的 IP 地 址 将 会 带 来 便利 。 回 想 第 3 章 ， 一 个 因特网 应 用 程序 需要 知道 它 
与 之 通信 的 远 端 实体 的 TP 地 址 和 端口 号 。 如 果 一 个 移动 实体 在 移动 过 程 中 能 够 保 
持 其 IP 地 址 不 变 ， 从 应 用 的 角度 ， 移 动 性 就 变 得 不 可 见 。 这 种 透明 性 有 十 分 重要 
的 价值 ， 即 应 用 程序 不 必 关 心 IP 地 址 潜在 的 变化 ， 并 且 同 样 的 应 用 程序 代码 既 可 
用 于 移动 连接 ， 又 可 用 于 非 移动 连接 。 在 下 一 节 我 们 将 会 看 到 移动 IP 提供 了 这 种 
透明 性 ， 它 允许 移动 结 点 在 网 络 间 移动 的 同时 维持 其 永久 的 IP 地 址 。 

在 男 一 方面 ， 一 个 不 太 喜 欢 新 潮 的 移动 用 户 也 许 只 想 关 闭 办 公 室 便携 机 ， 将 
其 带 回 家 ， 然 后 开机 ， 再 在 家 中 工作 。 如 果 该 便携 机 在 家 时 只 是 作为 一 个 客户 ， 
使 用 客户 -服务 器 方式 的 应 用 ( 如 发 送 / 阅 读 电子 邮件 、 浏 览 Web, Hit Telnet 与 
远程 主机 相连 ) ， 则 使 用 特定 IP 地 址 并 不 是 那么 重要 。 特 别 是 ， 用 户 能 够 得 到 一 
个 由 服务 于 家 庭 的 ISP 临时 分 配 的 IP 地址 即 可 。 我 们 在 4.4 节 中 看 到 的 DHCP 提 
供 了 这 种 功能 。 
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© 有 哪些 可 用 的 有 线 基 础 设施 的 支持 ”在 所 有 上 述 情形 中 ， 我 们 都 隐 含 地 假设 存在 
-个 固定 的 基础 设施 让 移动 用 户 连 接 ， 例 如 家 庭 的 ISP 网 络 、 办 公 室 的 无 线 接 入 
网 ， 或 者 沿 高 速 公路 的 无 线 接 入 网 。 如 果 这 样 的 基础 设施 不 存在 会 怎么 样 ” 如 果 
两 个 用 户 位 于 彼此 的 通信 范围 内 ， 他 们 能 否 在 没有 其 他 网 络 基 础 设施 存在 的 情况 
下 建立 一 个 网 络 连接 ?” 自 组 织 网 络 正 好 提供 了 这 些 能 力 。 这 一 飞速 发 展 的 领域 位 
PRAM AWE A. RE SASS. [Perkins 2000 | 和 IETF 移动 日 组 织 
网 络 (manet) 工作 组 主页 [manet 2012] 提供 了 有 关 这 一 主题 的 详尽 讨论 。 
为 了 阐述 允许 移动 用 户 在 不 同 网 络 间 移动 过 程 中 维持 正在 进行 的 连接 所 涉及 的 问题 ， 
我 们 考虑 一 个 人 类 的 类 比例 子 . 一 位 20 岁 左右 的 青年 从 家 里 搬出 ， 成 为 流动 的 人 ， 在 一 
些 箔 舍 或 公 离 大 位 ， 并 经 常 改换 住 址 。 如 果 一 个 老 朋友 想 与 他 联系 ， 这 位 朋友 怎样 才能 找 
到 这 个 流动 的 朋友 呢 ? 一 种 般 用 的 方法 是 与 他 的 家 庭 取 得 联系 ， 因 为 一 位 流动 的 青年 通 帝 
会 将 其 日 前 的 地 址 告诉 家 里 (即使 没有 其 他 原因 ， 哪 怕 只 是 为 了 让 父母 寄 钱 来 帮 他 付 房 
租 ) ， 其 家 庭 由 于 有 一 个 永久 地 址 ， 因 此 成 为 其 他 想 与 该 流动 青年 联系 的 人 可 采用 的 第 一 
步 。 这 些 朋友 后 来 与 他 的 通信 也 许 是 间接 的 (如 先 将 邮件 发 送 到 其 父母 家 ， 骨 转发 给 该 流 
动 的 译 年 )， 也 许 是 直接 的 如 该 朋友 用 得 到 的 地 址 直接 将 邮件 发 送 给 其 流动 的 朋友 ). 
在 一 个 网 络 环境 中 ， 一 个 移动 结 点 (如 一 台 便 携 机 或 智能 手机 ) 的 永久 居所 被 称 为 归 
属 网 络 (home network ) ， 在 归属 网 络 中 代表 移动 结 点 执行 下 面 讨论 的 移动 管理 功能 的 实体 
叫 归 属 代 理 (home agent). 移动 结 点 当前 所 在 网 络 叫 做 外 部 网 络 (foreign network) 或 被 
访 网 络 (visited network) ， 在 外 部 网 络 中 帮助 移动 结 点 做 移动 管理 功能 的 实体 称 为 外 部 代 
理 (foreign agent) ， 对 于 移动 的 专业 人 员 而 言 ， 他 们 的 归属 网 络 可 能 就 是 其 公司 网 络 ， 而 
被 访 网 络 也 许 就 是 他 们 正 访问 的 某 同 行 所 在 的 网 络 。 一 -个 通信 者 (correspondent) 就 是 布 
望 与 该 移动 结 点 通信 的 实体 ,图 6-22 阐述 了 这 些 概念 ， 也 说 明了 下 面 考虑 的 编 址 概念 
在 网 6-22 中 ， 我 们 注意 到 代理 被 配置 在 路 由 融 上 〈 例 如 ， 作 为 在 路 由 希 上 运行 的 进程 )， 
但 它们 也 能 在 网 络 中 其 他 主机 或 服务 大 上 执行 。 
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图 6-22 移动 网 络 体系 结构 中 的 初始 要 素 
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6.5.1 Fut 


我 们 前 面 提 到 为 了 使 用 户 移 动 性 对 网 络 应 用 透明 ， 和 希望 一 个 移动 结 点 在 从 一 个 网 络 移 
动 到 男 一 个 网 络 时 保持 其 地 址 不 变 。 当 某 移 动 结 点 位 于 一 个 外 部 网 络 时 ， 所 有 指 问 此 结 点 
固定 地 址 的 流量 需要 导 癌 外 部 网 络 。 怎 样 才能 做 到 这 一 点 呢 ” 外 部 网 络 可 用 的 一 种 方法 就 
是 癌 所 有 其 他 网 络 发 通告 ， 告 诉 它们 该 移动 结 点 正在 它 的 网 络 中 。 这 通常 可 通过 交换 域内 
与 域 间 路 由 选择 信息 来 实现 ， 而 且 只 需 对 现 有 路 由 选择 基础 设施 做 很 少 的 改动 即 可 。 外 部 
网 络 只 震 通 告 其 邻居 它 有 一 条 非常 特别 的 路 由 能 到 达 该 移动 结 点 的 固定 地 址 ， 即 告诉 其 他 
网 络 它 有 一 条 正确 的 路 径 可 将 数据 报导 问 该 移动 结 点 的 固定 地 址 ( 即 基 本 上 是 通知 其 他 网 
络 ， 它 有 一 条 可 将 数据 报 路 由 选择 到 该 移动 结 点 的 永久 地 址 的 正确 路 径 ; 参见 4.4 节 )。 
这 些 邻 居 将 在 全 网 传播 该 路 由 选择 信息 ， 而 且 是 当 作 更 新 路 由 选择 信息 和 转发 表 的 正常 过 
程 的 一 部 分 来 做 ， 当 移动 结 点 离开 一 个 外 部 网 络 后 又 加 入 另 一 个 外 部 网 络 时 ， 新 的 外 部 网 
络 会 通告 一 条 新 的 通 向 该 移动 结 点 的 特别 路 由 ， 旧 的 外 部 网 络 将 撤销 其 与 该 移动 结 点 有 关 
的 路 由 选择 信息 

这 种 方法 立刻 解决 了 两 个 问题 ， 且 它 这 样 做 不 需 对 网 络 层 基础 设施 做 重大 改动 。 其 他 
网 络 知道 该 移动 结 点 的 位 置 ， 很 容易 将 数据 报 路 由 到 该 移动 结 点 ， 因 为 转发 表 将 这 些 数 据 
报导 向 外 部 网 络 。 然 而 它 有 一 个 很 大 的 缺陷 ， 即 扩展 性 不 好 。 如 果 移 动 性 管理 是 网 络 路 由 
需 的 责任 的 话 ， 则 路 由 器 将 必须 维护 可 能 多 达 数 百 万 个 移动 结 点 的 转发 表 表 项 ， 在 本 草 后 
面 的 习题 中 将 探讨 一 些 其 他 的 缺陷 

一 种 替代 的 方法 (并 在 实际 中 得 到 了 采用 ) 是 将 移动 性 功能 从 网 络 核心 搬 到 网 络 边 
缘 ， 这 是 我 们 在 人 研究 因特网 体系 结构 时 一 再 重复 的 主题 ， 一 种 和 白 然 的 做 法 是 由 该 移动 结 点 
的 归属 网 络 来 实现 。 与 那个 流动 青年 的 父母 跟踪 他 们 孩子 的 位 置 有 许多 相似 之 处 ， 在 移动 结 
点 的 归属 网 络 中 的 归属 代理 也 能 跟踪 该 移动 结 点 所 在 的 外 部 网 络 。 这 当然 而 要 一 个 移动 顷 点 
(或 一 个 代表 该 移动 结 点 的 外 部 代理 ) 与 归属 代理 之 间 的 协议 来 更 新 移动 结 点 的 位 置 。 


我 们 现在 更 详细 地 来 思考 外 部 代理 。 如 图 6-22 所 示 ， 概念 上 最 简单 的 方法 是 将 外 部 
代理 放置 在 外 部 网 络 的 边缘 路 由 咒 上 。 外 部 代理 的 作用 之 一 就 是 为 移动 结 点 创建 一 个 所 谓 


的 转交 地 址 (Care-Of Address, COA), i% COA 的 网 络 部 分 与 外 部 网 络 的 网 络 部 分 相 匹 配 。 
因此 一 个 移动 结 点 可 与 两 个 地 址 相关 联 ， 即 其 永久 地 址 (permanent address) (类 比 于 流动 
青年 的 家 庭 地 址 ) 与 其 COA， 该 COA 有 时 又 称 为 外 部 地 址 (foreign address) (类 比 于 流动 译 
年 当前 居住 的 房屋 地 址 ) 。 在 图 6-22 中 的 例子 中 ， 移 动 结 点 的 固定 地 址 是 128. 119. 40. 186. 
当 被 访 网 络 为 79. 129. 13/24 时 ， 该 移动 结 点 具有 的 COA 为 79. 129. 13.2。 外 部 代理 的 第 二 个 
作用 就 是 告诉 归属 代理 ， 该 移动 结 点 在 它 的 〈 外 部 代理 的 ) 网 络 中 且 具 有 给 定 的 COA- 我 们 
很 快 就 会 看 到 ， 该 COA 将 用 于 将 数据 报 通 过 外 部 代理 “重新 路 由 选择 ”到 移动 结 点 。 

虽然 我 们 已 将 移动 结 点 与 外 部 代理 的 功能 分 开 ， 但 是 应 当 注 意 到 移动 结 点 也 能 承担 外 
部 代理 的 责任 。 例 如 ， 某 移动 结 点 可 在 外 部 网 络 中 得 到 一 个 COA (使 用 一 个 诸如 DHCP 之 
类 的 协议 ) ， 且 由 它 自己 把 其 COA 通告 给 归属 代理 。 


6.5.2 路 由 选择 到 移动 结 点 


我 们 现在 已 看 到 一 个 移动 结 点 是 如 何 得 到 一 个 COA 的 ， 归 属 代理 又 是 如 何 被 告知 该 
地 址 的 。 但 让 归属 代理 知道 该 COA 仅 能 解决 部 分 问题 。 数 据 报应 怎样 寻 址 并 苇 发 给 移动 
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Za? 因为 只 有 归属 代理 CAE a) 知道 该 移动 结 点 的 位 置 ， 故 如 果 只 是 
将 一 个 数据 报 寻 址 到 移动 结 点 的 永久 地 址 并 将 其 发 送 到 网 络 层 基 础 结构 中 ， 这 样 做 已 不 再 
满足 需要 了 。 还 有 更 多 的 事情 要 做 ， 目 前 有 两 种 不 同 的 方法 ， 我们 将 称 其 为 间接 路 由 选择 
选择 . 
.移动 结 点 的 间接 路 由 选择 

我 们 先 考 虑 一 个 想 给 移动 结 点 发 送 数据 报 的 通信 者 .在 间接 路 由 选择 (indirect rou- 
ting) 方法 中 ， 通 信者 只 是 将 数据 报 re tee kt 并 将 数据 报 发 送 到 网 络 
中 去 ， 完 全 不 知道 移动 结 点 是 在 归属 网 络 中 还 是 正在 访问 某 个 外 部 网 络 ， 因 此 移动 性 对 于 
通信 者 来 说 是 完全 透明 的 . 这 些 数据 报 就 像 平常 my 这 用 
图 6-23 中 的 步骤 1 加 以 说 明 . 






归属 网 络 : 被 访 网 络 : 
128.119.40/24 79.129,13/24 
移动 结 点 
po 
E KAHH: 
= 128.119.40.186 永久 地 址 : 
~ 128.119.40.186 


转交 地 址 : 
79.129.13.2_, 





通信 者 


图 6-23 ”对 移动 结 点 的 间接 路 由 选择 


我 们 现在 将 注意 力 转 回归 属 代理 。 除 了 负责 与 外 部 代理 交互 以 跟踪 移动 结 点 的 COA 
外 ， 归 属 代理 还 有 男 一 项 很 重要 的 功能 。 它 的 第 二 项 工作 就 是 监视 到 达 的 数据 报 ， 这 些 数 
据 报 寻 址 的 结 点 的 归属 网 络 与 该 归属 代理 所 在 网 络 相 同 ， 但 这 些 结 点 当前 却 在 某 个 外 部 网 
络 中 。 归 属 代 理 截 获 这 些 数据 报 ， 然 后 按 一 个 两 步骤 的 过 程 转发 它们 。 通 过 使 用 移动 结 点 
的 COA ， 该 数据 报 先 转发 给 外 部 代理 (图 6-23 中 的 步骤 2) ， 然 后 再 从 外 部 代理 转发 给 移 
动 结 点 (图 6-23 中 的 步骤 3) 。 

仔细 地 思考 这 种 重新 路 由 选择 过 程 是 有 益 的 。 归 属 代 理 需 要 用 该 移动 结 点 的 COA 来 
设置 数据 报 地 址 ， 以 便 网 络 层 将 数据 报 路 由 选择 到 外 部 网 络 .在 另 一 方面 ， 需 要 保持 通信 
者 数据 报 的 原样 ， 因 为 接收 该 数据 报 的 应 用 程序 应 该 不 知道 该 数据 报 是 经 由 归属 代理 转发 
而 来 的 。 让 归属 代理 将 通信 者 的 原始 完整 数据 报 封装 (encapsulate) 在 一 个 新 的 (EK 
的 ) 数据 报 中 ， 这 两 个 目标 都 可 以 得 到 满足 。 这 个 较 大 的 数据 报 被 导向 并 交付 到 移动 结 点 
的 COA-“ 拥 有 ”该 COA 的 外 部 代理 将 接收 并 拆 封 该 数据 报 ， 即 从 较 大 的 封装 数据 报 中 取 
出 通信 者 的 原始 数据 报 ， 然 后 再 向 移动 结 点 转发 该 原始 数据 报 (图 6-23 中 的 步骤 3)。 
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网 6-24 显 示 了 如 下 过 程 : 一 个 通信 者 回归 属 网 络 发 送 原 始 数据 报 ; 向 外 部 代理 发 送 一 个 封 
疙 的 数据 报 ; 以 及 加 移动 结 点 交付 最 初 的 数据 报 。 思 维 敏 锐 的 读者 将 会 注意 到 ， 这 里 描述 
的 封 表 / 拆 封 概念 等 同 于 隧道 的 概念 ， 隧 着 是 在 第 4 章 中 讨论 IP 多 播 与 IPv6 时 涉及 的 。 
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a p 
_128.11940.186 


ea 


Beal 


<< 
通信 者 
图 6-24 ”封装 与 拆 封 


接 下 来 我 们 考虑 某 移动 结 点 如 何 回 一 个 通信 者 发 送 数据 报 。 这 相当 简单 ， 因 为 移动 结 
点 可 直接 将 其 数据 报 寻 址 到 通信 者 〈 使 用 自己 的 永久 地 址 作为 源 地 址 ， 通 信者 的 地 址 作为 
目的 地 址 ) 。 因 为 移动 结 点 知道 通信 者 的 地 址 ， 所 以 没有 必要 通过 归属 代理 迁 回 传送 数据 
报 。 这 就 是 显示 在 图 6-23 中 的 步骤 4。 
下 面 通 过 列 出 支持 移动 性 所 需要 的 网 络 层 新 功能 ， 我 们 小 结 一 下 对 有 关 间 接 路 由 选择 
的 讨论 。 
© 移动 结 点 到 外 部 代理 的 协议 。 当 移动 结 点 连接 到 外 部 网 络 时 ， 它 向 外 部 代理 注册 。 
类 似 地 ， 当 一 个 移动 结 点 离开 该 外 部 网 络 时 ， 它 将 向 外 部 代理 取消 注册 。 

e 外 部 代理 到 归属 代理 的 注册 协议 。 外 部 代理 将 向 归属 代理 注册 移动 结 点 的 COA。 
当 某 移动 结 点 离开 其 网 络 时 ， 外 部 代理 不 需要 显 式 地 注销 COA， 因 为 当 移动 结 点 
移动 到 一 个 新 网 络 时 ， 随 之 而 来 就 要 注册 一 个 新 的 COA， 这 将 完成 了 注销 。 

© 归属 代理 数据 报 封装 协议 。 将 通信 者 的 原始 数据 报 封装 在 一 个 目的 地 址 为 COA 的 

数据 报 内 ， 并 转发 之 。 

e 外 部 代理 拆 封 协议 。 从 封装 好 的 数据 报 中 取出 通信 者 的 原始 数据 报 ， 然 后 再 将 该 

原始 数据 报 转发 给 移动 结 点 。 

上 述 讨 论 提 供 了 一 个 移动 结 点 在 网 络 之 间 移 动 时 要 维持 一 个 不 间断 的 连接 所 需 的 各 部 
分 : 外 部 代理 、 归 属 代 理 和 间接 转发 。 举 一 个 例子 来 说 明 这 些 部 分 是 如 何 协同 工作 的 。 假 
设 某 移动 结 点 连 到 外 部 网 络 A， 向 其 归属 代理 注册 了 网 络 A 中 的 一 个 COA， 并 且 正 在 接收 
通过 归属 代理 间接 路 由 而 来 的 数据 报 。 该 移动 结 点 现在 移动 到 外 部 网 络 B 中 ， 并 向 网 络 B 
中 的 外 部 代理 注册 ， 外 部 代理 将 该 移动 结 点 的 新 COA 告诉 了 其 归属 代理 。 此 后 ， 归 属 代 
理 将 效 据 报 重 路 由 到 网 络 B。 就 一 个 通信 者 关心 的 东西 而 言 ， 移 动 性 是 透明 的 ， 即 在 移动 
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前 后 ， 数 据 报 都 是 由 相同 的 归属 代理 进行 路 几 选 择 ， 就 归属 代理 关心 的 东西 而 言 ， 数 据 报 
流 没有 中 断 ， 即 到 达 的 数据 报 先 是 转发 到 外 部 网 络 A; 改变 COA 后 . 则 数据 报 转 发 到 外 
部 网 络 Bo 但 当 移 动 结 点 在 网 络 之 团 移 动 时 ， 它 会 看 到 数据 报 流 中 断 吗 ? 只 要 移动 结 点 与 
网 络 A 断 开 连接 (此 时 它 不 能 再 经 A 接收 数据 报 ) 再 连接 到 网 络 B (此 时 它 将 回归 属 代 
理 注册 一 个 新 的 COA) 用 的 时 间 少 ， 那 么 几乎 没有 丢失 数据 报 。 第 3 FER, aay El via EF 
可 能 会 由 于 网 络 拥塞 而 丢失 数据 报 . 因而 当 一 个 结 点 在 网 络 之 间 移 动 时 ， 一 条 连接 中 的 数 
据 报 偶尔 丢失 算 不 上 什么 灾难 性 问题 。 如果 需 要 进行 无 丢失 的 通信 ， 则 上 层 机 制 将 对 数据 
报 于 失 进 行 恢 复 ， 不 管 这 种 丢失 是 因 网 络 拥塞 还 是 因 用 户 移 动 而 引发 的 。 

在 移动 下 标准 中 使 用 了 一 种 间接 路 由 选择 方法 | RFC 5944 ] ， 这 将 在 6.6 市 中 讨论 . 

2. 移动 结 点 的 直接 路 由 选择 

{ERI 6-23 中 曾 述 了 间接 路 由 选择 方法 存在 一 个 低 效 的 问题 ， 即 三 角 路 由 选择 问题 
(triangle routing problem) ， 该 问题 是 指 即 使 在 通信 者 与 移动 结 点 之 间 存 在 一 条 更 有 效 的 路 
由 ， 发 往 移动 续 点 的 数据 报 也 要 先 发 给 归属 代理 ， 然 后 髓 发送 到 外 部 网 络 。 在 最 坏 情 况 
下 ， 设 想 一 个 移动 用 户 正 在 访问 一 位 同行 所 在 的 外 部 网 络 ， 两 人 并 排 坐 在 一 起 且 正 在 通过 
网 络 交 换 数 据 。 从 通信 者 〈 在 该 例 中 为 该 访问 者 的 同行 ) 处 发 出 的 数据 报 被 路 由 选择 到 该 
移动 用 户 的 归属 代理 ， 然 后 再 回 到 该 外 部 网 络 ! 

直接 路 由 选择 (direct routing) 克服 了 三 角 路 由 选择 的 低 效 问 题 ， 但 却 是 以 增加 复杂 
性 为 代价 的 .在 直接 路 由 选择 方法 中 ， 通 信者 所 在 网 络 ， eae ( correspond- 
ent agent) 先知 道 该 移动 结 点 的 COA。 这 可 以 通过 让 通信 者 代理 回归 属 代 理 询问 得 知 ， 这 
里 假设 与 间接 路 由 选择 情况 类 似 ， 移 动 结 点 具有 一 个 在 归属 代理 注册 过 的 最 新 的 COA. 5 
移动 结 总 可 以 执行 外 部 代理 的 功能 相 类 似 ， 通 信者 本 号 也 可 能 执行 通信 者 代理 的 功能 在 
图 6-25 中 显示 为 步骤 1 和 步骤 2。 通信 者 代理 然后 将 数据 报 直接 通过 隧道 技术 发 住 移动 结 
点 的 COA， 这 与 归属 代理 使 用 的 隧道 技术 相 类 似 ， 参 几 轩 6-25 的 步骤 3 和 步骤 4. 


Fil bbe « 被 访 网 络 : 
归属 网 络 : 79.129.13/24 


128.119.40/24 


永久 地 址 : 
= 128.119.40.186 





归属 “SS 外 部 79.129.13.2 
fH. O 广域网 代理 





图 6-25 到 某 移动 用 户 的 直接 路 由 选择 
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E ATLA ere eR PAR tE, (ES LA T AAE A Ee ey : 
e 需要 一 个 移动 用 户 定 位 协议 (mobile-user location protocol), ， 以 便 通 信者 代理 回归 
属 代理 查询 获得 移动 结 点 的 COA (图 6-25 中 的 步骤 1 和 步 又 2) 
e 当 移 动 结 各 从 一 个 外 部 网 络 移 到 为 一 个 外 部 网 络 时 ， 如 何 将 数据 报 转发 到 新 的 外 
部 网 络 ?” 在 间接 路 由 选择 的 情况 下 ， 这 个 问题 可 以 容易 地 通过 更 新 由 归属 代理 维 
FAY COA 来 解决 。 然 而， 使 用 直接 路 由 选择 时 ， 月 属 代理 仅 在 会 话 开始 时 被 通信 
者 代理 询问 一 次 COA, 因此 ， 当 必要 时 在 归属 代理 中 更 新 COA， 这 并 不 足以 解决 
将 数据 路 由 选择 到 移动 结 点 新 的 外 部 网 络 的 问题 
一 种 解决 方案 是 创建 一 个 新 的 协议 来 告知 通信 者 变化 后 的 COA， 男 一 种 方案 也 是 在 GSM 
网 各 实践 中 所 采用 的 廊 案 ， 它 的 工作 方式 如 下 .假设 数据 当前 正 转 发 给 位 于 Rh 中 
的 移动 结 点 ， 并 且 在 会 话 刚 开始 时 该 移动 结 点 就 位 于 该 网 络 中 (图 6-26 中 的 步 又 1) 我们 
将 站 er opr 部 网 络 中 的 外 部 代理 标识 为 锚 外 部 代理 (anchor foreign = 
移动 结 点 到 达 一 个 新 外 部 网 络 后 (图 6-26 中 的 步骤 2)， 移 动 结 点 a ee W (CAB 
W3), FP Aah A CHE a) fai ba ee eS Zi COA ( 步 又 4)。 当 锚 外 部 代理 收 到 
一 个 发 往 已 经 离开 的 移动 结 点 的 封装 数据 报 后 ， ea 数据 报 并 将 
其 转发 给 该 移动 结 点 ( 步 骂 5)。 如 果 移 动 结 点 其 后 义 移 到 男 一 个 外 部 网 络 中 ， 在 该 被 访 网 
络 中 的 外 部 代理 随后 将 与 锚 外 部 代理 联系 ， 以 便 建 立 到 该 新 外 部 网 络 的 转发 , 


归属 网 络 在 会 话 开始 时 被 
访问 的 外 部 网 络 ， 
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网 6-26 在 网 络 间 使 用 直接 路 由 选择 的 移动 转移 


6.6 移动 IP 


文 持 移动 性 的 因特网 体系 结构 与 协议 合 起 来 称 为 移动 IP， 对 IPv4 主要 由 RFC 5944 3E 
Lo Ba IP 是 一 个 有 灵活 的 标准 ， 支 持 许 多 不 同 的 运行 模式 (例如 ， 上 有 具有 或 不 具有 外 部 代 
理 的 运行 ) ， 代 理 与 移动 结 点 相互 发 现 的 多 种 方式 ， 使 用 单个 或 多 个 COA ， 以 及 多 种 形式 
WER FE., BI IP 是 一 个 复杂 的 标准 ,需要 用 整 本 书 才能 详细 描述 ; 的 确 有 这 样 - 
本 书 | Perkins 1998b |. 这里， 我 们 最 基本 的 目标 是 对 移动 IP 最 重要 的 部 分 进行 概述 ， 并 
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说 明 它 在 一 些 常 见 情形 中 的 使 用 ， 

移动 IP 体系 结构 包含 了 许多 我 们 前 面 考 虑 过 的 要 素 ， 包 括 归 属 代 理 、 外 部 代理 、 转 
区 地 址 和 封 闻 / 拆 封 等 概念 。 当前 的 标准 | RFC 5944 ] 规定 到 移动 结 点 使 用 间接 路 由 选择 
的 方法 。 

移动 IP 标准 由 三 部 分 组 成 : 

e 代理 发 现 。 移动 IP 定 义 了 一 个 归属 代理 或 外 部 代理 用 来 向 移动 结 点 通告 其 服务 的 

协议 ， 以 及 移动 结 点 请 求 一 个 外 部 代理 或 归属 代理 的 服务 所 使 用 的 协议 。 

e 向 归属 代理 注册 。 移动 IP 定 义 了 移动 结 点 和 /或 外 部 代理 癌 一 个 移动 结 点 的 归属 

代理 注册 或 注销 COA 所 使 用 的 协议 。 

o 数据 报 的 间接 路 由 选择 。 该 标准 也 定义 了 数据 报 被 一 个 归属 代理 转发 给 移动 结 点 

的 方式 ， 包 括 转 发 数据 报 使 用 的 规则 、 处 理 差 铺 情 况 的 规则 和 几 种 不 同 的 封装 形 
式 [RFC 2003; RFC 2004 ] . 

在 整个 移动 IP 标准 中 安全 性 的 考虑 是 很 重要 的 。 例 如， 显然 需要 对 一 个 移动 结 点 进 
行 鉴别 以 确保 一 个 恶意 用 户 不 能 向 归属 代理 注册 一 个 伪造 的 转交 地 址 ， 伪 造 地 址 将 导致 所 
有 发 给 某 个 IP 地 址 的 数据 报 被 重 定 问 到 恶意 用 户 。 移 动 IP 使 用 许多 机 制 来 实现 安全 性 ， 
我 们 将 在 第 8 章 考 察 这 些 机 制 ， 在 以 下 的 讨论 中 将 不 考虑 安全 性 问题 

1. 代理 发 现 

到 达 一 个 新 网 络 的 菜 移动 IP 结 点 ,不 管 是 连 到 一 个 外 部 网 络 还 是 返回 其 归属 网 络 ， 
它 部 必须 知道 相应 的 外 部 代理 或 归属 代理 的 身份 。 的 确 ， 这 是 新 外 部 代理 的 发 现 ， 通 过 一 
个 新 的 网 络 地 址 ， 才 使 移动 结 点 中 的 网 络 层 知道 它 已 进入 一 个 新 的 外 部 网 络 。 这 个 过 程 被 
称 为 代理 发 现 (agent discovery ) 。 代 理发 现 可 以 通过 下 列 两 种 方法 之 一 实现 : 经 代理 通告 
或 者 经 代理 请 求 。 

值 助 于 代理 通告 ( agent advertisement ) ， 外 部 代理 或 归属 代理 使 用 一 种 现 有 路 由 器 发 
现 协 议 的 扩展 协议 【RFC 1256] 来 通告 其 服务 。 该 代理 周期 性 地 在 所 有 连接 的 链 路 上 广 
播 一 个 类 型 字段 为 9 (路 由 器 发 现 ) 的 ICMP 报 文 。 路 由 器 发 现 报 文 也 包含 路 由 器 〈 即 该 
代理 ) 的 了 下 地 址 ， 因 此 允许 一 个 移动 结 点 知道 该 代理 的 卫 地 址 。 路 由 占 发 现 报 文 还 包括 
了 一 个 移动 性 代理 通告 扩展 ， 其 中 包含 了 该 移动 结 点 所 需 的 附加 信息 。 在 这 种 扩展 中 有 如 
下 一 些 较 重要 的 字段 : 

e 归属 代理 比特 (H)。 指 出 该 代理 是 它 所 在 网 络 的 一 个 归属 代理 。 

e 外 部 代理 比特 (下 ) 。 指 出 该 代理 是 它 所 在 网 络 的 一 个 外 部 代理 。 

e 注册 要 求 比特 (R)。 指 出 在 该 网 络 中 的 某 个 移动 用 户 必 须 回 某 个 外 部 代理 注册 . 

竺 别 是 ， 一 个 移动 用 户 不 能 在 外 部 网 络 (如 使 用 DHCP) 中 获得 一 个 转交 地 址 ， 
并 假定 由 它 自己 承担 外 部 代理 的 功能 ， 无 需 身 外 部 代理 注册 -。 
e。 M、G 封装 比特 。 指 出 除了 “IP 中 的 IP”(1IP-in-IP) 封 表 形式 外 ， 是 否 还 要 用 其 


他 的 封装 形式 。 
o 转交 地 址 (COA) 字段 。 由 外 部 代理 提供 的 一 个 或 多 个 转交 地 址 的 列表 。 在 下 面 
的 例子 中 ，COA 将 与 外 部 代理 关联 ， 外 部 代理 将 接收 发 给 该 COA 的 数据 报 ， 然 后 


青 转发 到 适当 的 移动 结 点 。 移 动用 户 在 向 其 归属 代理 注册 时 将 选择 这 些 地 址 中 的 
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图 6-27 说 明了 在 代理 通告 报 文 中 的 茶 些 关键 字段 。 
0 8 16 24 
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图 6-27 具有 移动 性 代理 通告 扩展 的 ICMP 路 由 需 发 现 报 文 


使 用 代理 请 求 (agent solicitation) ， 一 个 想 知道 代理 的 移动 结 点 不 必 等 待 接收 代理 通 
告 ， 就 能 广播 一 个 代理 请 求 报 文 ， 该 报 文 只 是 一 个 类 型 值 为 10 的 ICMP 报 文 。 收 到 该 请 求 
的 代理 将 直接 向 该 移动 结 点 单 播 一 个 代理 通告 ， 于 是 该 移动 结 点 将 继续 处 理 ， 就 好 像 刚 收 
到 一 个 未 经 请 求 的 通告 一 样 

2 向 归属 代理 注册 

一 日 某 个 移动 IP 结 点 收 到 一 个 COA， 则 该 地 址 必须 要 向 归属 代理 注册 。 这 可 通过 外 
部 代理 (由 它 向 归属 代理 注册 该 COA) 或 直接 通过 移动 IP 结 点 自己 来 完成 。 我 们 下 面 考 
虑 前 一 种 情况 ， 共 涉及 4 个 步骤 。 

1) 当 收 到 一 个 外 部 代理 通告 后 ， 一 个 移动 结 点 立即 向 外 部 代理 发 送 一 个 移动 IP 注册 
报 文 。 注册 报 文 承载 在 一 个 UDP 数据 报 中 并 通过 端口 434 发 送 。 注 册 报 文 携带 以 下 内 容 : 
一 个 由 外 部 代理 通告 的 COA、 归 属 代 理 的 地 址 ( HA) 、 移 动 结 点 的 永久 地 址 (MA) 、 请 
求 的 注册 寿命 和 一 个 64 比特 的 注册 标识 。 请求 的 注册 寿命 指示 了 注册 有 效 的 秒 数 。 如 果 
注册 没有 在 规定 的 时 间 内 在 归属 代理 上 更 新 ， 则 该 注册 将 变 得 无 效 。 注 册 标识 就 像 一 个 序 
号 ， 用 于 收 到 的 注册 回答 与 注册 请 求 的 匹配 〈 下 面 会 讨论 ) 。 

2) 外 部 代理 收 到 注册 报 文 并 记录 移动 结 点 的 永久 IP 地址 。 外 部 代理 知道 现在 它 应 该 
查找 这 样 的 数据 报 ， 即 它 封装 的 数据 报 的 目的 地 址 与 该 移动 结 点 的 永久 地 址 相 匹 配 。 外 部 
代理 然后 向 归属 代理 的 434 端口 发 送 一 个 移动 IP 注册 报 文 (同样 封装 在 UDP 数据 报 中 )。 
这 一 报 文 包括 COA 、HA 、MA 、 封 装 格式 要 求 、 请 求 的 注册 寿命 以 及 注册 标识 。 

3) 归属 代理 接收 注册 请 求 并 检查 真实 性 和 正确 性 。 归 属 代理 把 移动 结 点 的 永久 IP 地 
址 与 COA 绑 定 在 一起 。 以后， 到 达 该 归属 代理 的 数据 报 与 发 往 移动 结 点 的 数据 报 将 被 封 
装 并 以 障 道 方式 给 COA。 归 属 代理 发 送 一 个 移动 IP 注册 回答 ， 该 响应 报 文 中 包含 有 HA, 
MA 、 实 际 注 册 寿 命 和 被 认可 的 请 求 报 文 注 册 标 识 。 

4) 外 部 代理 接收 注册 响应 ， 然 后 将 其 转发 给 移动 结 点 ， 














到 此 ， 注 册 便 完成 卫 ， 移 动 结 点 就 能 接收 发 送 到 其 永久 地 址 的 数据 报 . 图 6-28 说 明 
这 些 步 注意 到 归属 代理 指定 的 寿命 比 移动 结 点 请 求 的 寿命 要 小 
被 访 网 络 
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一 一 一 一 一 一 -一 一 
移动 代理 
MA: 128.119.40.186 


HA: 128.119.40.7 COA: 79.129.13.22 





ICMP 代 理 通 告 








注册 回答 
HA:128. 119.40.7 
MA:128,119.40.186 
Lifetime:4999 
identification:714 










© y x 


时 间 时 间 时 间 
图 6-28 ”代理 通告 与 移动 IP 注册 
当 某 个 移动 结 点 离开 其 网 络 时 ， 外 部 代理 无 需 显 式 地 取消 某 个 COA 的 注册 。 当 移动 
结 点 移动 到 一 个 新 网 (不管 是 男 一 个 外 部 网 络 还 是 其 归属 网 络 ) 并 注册 一 个 新 COA 时 ， 
上 述 情况 将 目 动 发 生 。 


际 了 上 和 面 所 描述 的 情况 ， 移动 IP 标准 还 允许 许多 另外 的 情形 和 功能 ， 有 兴趣 的 谈 者 
可 以 参阅 | Perkins 1998b; RFC 5944 | 


6.7 蜂 富 网 中 的 移动 性 管理 


分 析 了 IP 网 络 中 的 移动 性 管理 以 后 ， 我们 现 将 注意 力 转 癌 对 移动 性 文 挂 有 时 长 历史 
的 网 络 ， 即 蜂 祝 电话 网 络 。 尺 管 在 6.4 市 中 我 们 关注 过 蜂 久 网 中 的 第 一 跳 无 线 链 踏 ， 但 这 
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里 我 们 关注 移动 性 ， 并 以 GSM 蜂窝 网 络 体系 结构 | Goodman 1997; Mouly 1992; Scourias 
2012; Kaaranen 2001; Korhonen 2003; Turner 2012 | 作为 学 习 案 例 i 因为 它 是 一 个 成 就 并 
被 广泛 部 署 的 技术 。 与 在 移动 IP 中 的 情况 类 似 ， 我 们 将 会 看 到 6.5 市 指出 的 许多 基本 原 
理 都 被 包含 在 CSM 网 络 体 系 结构 中 ， 
与 移动 IP 类 似 ，GSM 采用 了 一 种 间接 路 由 选择 方法 ( 参见 6. 5.2 7), 首先 将 通信 者 
的 呼叫 路 由 选择 到 移动 结 点 的 归属 网 络 ， 再 从 那 到 达 被 访 网 络 : 在 GSM 术语 中 ， 移 动用 
户 的 归属 网 络 被 称 作 该 移动 用 户 的 归属 公共 地 域 移动 网 络 (home Publie Land Mobile 
Network, home PLMN). FAP Pr BEAM IA] PLMN 有 些 擂 口 ， 苦 虑 到 我 们 避免 稍 略 词 字 坪 
表 的 求 、 我 们 直接 将 GSM 归属 PLMN 称 为 归属 网 络 (home network). 4 5H P 1) 4 A 
蜂窝 网 提供 商 订 购 了 服务 ， 该 蜂 袖 网 就 成 为 了 这 些 用 户 的 归属 网 络 〈 即 该 提供 商 就 按 月 提 
itor 服务 收取 用 户 的 费用 )。 Posies 问 的 PLMN, 我 们 种 接 称 其 为 被 访 网 络 (visited 
network ) ， 是 移动 用 户 当 前 所 在 网 
与 移动 IP 中 情况 类 似 ， jaria 的 职责 有 很 大 的 差别 。 
e 轨 属 网 络 维护 一 个 称 作 归属 位 置 注册 器 (Home Location Register, HLR) 的 数据 
库 ， RiCHEE TA RAAMR RETOUR TAME. 重要 的 是 
HLR 也 包括 这 些 用 户 当 前 的 位 置信 息 。 这 就 是 说 ， 如 果 一 个 移动 用 户 当 前 漫游 到 
男 一 个 提供 商 的 蜂 视 网络 中 ，HLR 人 .来 获取 (通过 一 个 我 们 
即将 描述 的 过 程 ) 被 访 网 络 中 对 移动 用 户 的 呼叫 应 该 路 由 选择 到 的 地 址 。 我 们 将 
会 看 到 ， 当 一 个 呼叫 定位 到 一 个 移动 用 户 后 ， 通 信者 将 与 归属 网 络 中 一 个 被 称 作 
网 关 移 动 服 务 交 换 中 心 (Gateway Mobile services Switching Center, GMSC) 的 特殊 
交换 机 联系 。 同样， 为 避免 技 口 的 缩 略 词 ， 我 们 这 里 用 一 个 更 其 摘 述 性 的 术语 来 
称呼 CMSC ， 即 归属 MSC (home MSC). 
e 被 访 网 络 维 护 一 个 称 作 访问 者 位 置 注册 (Visitor Location Register, VLR) 的 数据 
库 。VLR 为 每 一 个 当前 在 其 服务 网 络 中 的 移动 用 户 包含 一 个 表 项 ，VLR 表 项 因此 
随 着 移动 用 户 进 入 和 离开 网 络 而 出 现 或 消失 VLR 通 第 与 移动 交换 中 心 (MSC ) 
在 一 起 ， 该 中 心 协 调 到 达 或 离开 被 访 网 络 的 呼叫 建立 
在 实践 中 ， 一 个 服务 商 的 蜂 祷 网 络 将 为 其 用 户 提 供 归属 网 络 服务 ， 同 时 为 在 其 他 蜂 贷 
服务 商 订 购 服 务 的 移动 用 户 提 供 被 访 网 络 服务 。 


6.7.1 对 移动 用 户 呼 叫 的 路 由 选择 


现在 我 们 描述 一 个 呼叫 如 何 定位 到 被 访 网 络 中 的 一 个 移动 GSM 用 户 。 我 们 首先 考虑 
下 面 一 个 简单 的 例子 ， 更 复杂 的 例子 在 | Mouly 1992) 中 有 描述 。 如 图 6-29 所 示 ， 这 些 步 
又 如 下 : 
1) 通信 者 拨打 移动 用 户 的 电话 号 三。 该 号 三 poodle ace 个 特定 的 电话 线路 或 位 
a (毕竟 电话 号 码 是 固定 的 ， 而 用 户 是 移动 的 !) ， 号 码 中 的 前 几 位 数字 足以 全 局 地 判别 移 
动用 户 的 归属 网 络 . ee deca 达 移 动用 户 归 属 网 络 中 的 归属 
MSC, Age 呼叫 的 第 一 步 。 
) 归属 MSC 收 到 该 呼叫 并 查询 HLR 来 确定 移动 用 户 的 位 置 。 在 最 简单 的 情况 下 ， 
HLR ee ( Mobile Station Roaming Number, MSRN) ， 我 们 称 其 为 漫游 号 
码 (roaming number). 注意 到 这 个 号 公 与 移动 用 户 的 永久 电话 号 码 不 同 ， 后 者 是 与 移动 用 
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户 的 归属 网 络 相 关联 的 ， 而 漫游 号 en 当 移 动用 户 进 入 一 个 被 访 网 络 后 ， ogg 
动用 户 临 时 分 配 一 个 漫游 号 in 码 的 作用 就 相当 于 移动 耻 中 转交 地 址 的 作用 。 并 
H, 与 COA 类 似 ， 人 不 可 见 的 。 如 果 HLR 不 具有 a 码 ， 
Esk RM ZAP VLR 的 地 址 。 在 这 种 情况 下 (未 在 网 6-29 中 显示 出 来 ) ， 归 属 MSC 需 
要 查询 VLR 以 便 获 取 移 动 结 点 的 漫游 号 码 。 但 是 HLR 是 如 何 首 先 得 到 漫游 号 码 或 VLR 地 
址 的 呢 ? 移动 用 户 到 另 一 个 被 访 网 络 后 这 些 值 将 发 生 怎 样 的 变化 ? 我 们 将 很 快 考虑 这 些 重 
要 问题 . 

3) 给 定 一 个 漫游 号 公 ， 归 属 MSC 通过 网 络 到 达 和 被 访 网 络 的 MSC 建立 呼叫 的 第 二 步 
至 此 ， 该 呼叫 已 经 完成 ， 从 通信 者 到 达 归 属 MSC, FEM VA Jag MSC 到 达 被 访 MSC， 然 后 到 
达 为 移动 用 户 提供 服务 的 基站 。 






归属 网 络 和 


图 6-29 将 呼叫 定位 到 一 个 移动 用 户 : 间接 路 由 选择 


在 第 二 步 中 ， 一 个 未 解决 的 问题 是 HLR 如 何 获 得 有 关 移 动用 户 位 置 的 信息 。 当 一 个 
移动 电话 切换 或 进入 一 个 由 新 的 VLR 所 覆盖 的 被 访 网 络 中 以 后 ,移动 用 户 必须 向 被 访 网 
络 注 册 ， 这 是 通过 在 移动 用 户 和 VLR 之 间 交 换 信 令 报 文 来 实现 的 。 被 访 VLR 随后 又 癌 移 
动用 户 的 HLR 发 送 一 个 位 置 更 新 请 求 报 文 。 这 一 报 文 告知 HLR 可 以 用 来 联系 移动 用 户 的 
漫游 号 码 ， 或 者 VLR 地 址 ( 它 可 以 用 来 随后 
查询 以 获取 移动 号 人 码 )。 作 为 这 个 交换 的 一 部 
分 ，VLR 同样 从 HLR 那里 获取 移动 用 户 的 信 
息 ， 以 及 确定 被 访 网 络 应 该 给 予 移 动用 户 什么 
样 的 服务 。 


6. 7.2 GSM 中 的 切换 


Ge >> Gy | 


"aaa 新 的 路 由 






7 
af 选择 
a 
Ti... ANIE + fo EZ > YE H g Y- HY 


off) 。 如 图 6-30 所 示 ， 移 动用 户 的 呼叫 初始 时 基站 间 的 切换 情况 
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(在 切换 前 ) 通过 一 个 基站 (我 们 称 其 为 旧 基 站 ) 路 由 选择 到 该 移动 用 户 ， 而 在 切换 以 后 
它 经 过 男 一 个 基站 (我 们 称 其 为 新 基站 ) 路 由 选择 到 移动 用 户 。 注 意 到 基站 之 间 的 切换 不 
仅 导 致 移动 用 户 回 /从 一 个 新 的 基站 传输 /接收 信号 ， 而 且 导 致 正在 进行 的 呼叫 从 网 络 中 的 
一 个 交换 点 到 新 基站 的 重 路 由 选择 。 我 们 首先 假设 新 旧 基 站 共享 同一 个 MSC， 并 且 重 路 由 
选择 发 生 在 这 个 MSC, 

有 几 种 原因 导致 切换 的 发 生 ， 包 括 : ( 山 当 前 基站 和 移动 用 户 之 间 的 信号 减弱 ， 使 得 该 
呼叫 有 被 中 断 的 危险 ; @ 一 个 蜂窝 处 理 的 呼叫 太 多 ， 变 得 过 载 .: 可 以 通过 将 一 些 移动 用 户 
切换 到 邻近 不 太 拥 考 的 蜂 坑 中 ， 使 这 个 拥塞 得 到 绥 解 。 

在 与 一 个 基站 相关 联 期 间 ， 移 动用 户 周 期 性 地 测量 来 和 月 其 当前 基站 和 临近 它 的 可 以 
“ 听 得 到 ”的 基站 的 信 标 信和 号 强度 。 这 些 测量 以 每 秒 1 ~ 2 次 的 频率 报告 给 移动 用 户 的 当前 
基站 - 根据 这 些 测量 值 、 临 近 蜂 宽 的 移动 用 户 的 当前 负载 以 及 其 他 因素 ，GSM 中 的 切换 由 
旧 的 基站 发 起 [Mouly 1992]. GSM 标准 并 未 明确 规定 基站 在 确定 是 否 进行 切换 时 所 采用 
的 具体 算法 。 

图 6-31 显示 了 当 一 个 基站 决定 切换 一 个 
移动 用 户 时 所 包括 的 步 又 : 

1) 旧 基 站 (BS) 通知 被 访问 MSC 即将 
要 进行 一 个 切换 ， 通 知 移动 用 户 将 要 切换 到 
的 BS (或 可 能 的 BS Æ). 

2) 被 访问 MSC 发 起 建立 到 新 BS 的 路 
径 ， 分 配 承载 重 路 由 选择 的 呼叫 所 需 的 资源 ， 
RAG SRI 

) 新 BS 分 配 并 激活 一 个 无 线 信道 供 移 

使 用 . 图 6-31 具有 一 个 公共 MSC 的 基站 间 

| ere ee asda. a me 完成 一 个 切换 的 步骤 

4) 新 BS 发 出 信 令 返回 被 访问 MSC ANIA 
BS， 即 已 经 建立 了 被 访问 MSC 到 新 BS 的 路 径 并 且 移 动用 户 应 当 被 告知 即将 发 生 的 切换 。 
新 BS 提供 移动 用 户 与 新 的 BS 相关 联 所 需要 的 所 有 信息 。 

5) 移动 用 户 被 告知 它 应 当 进 行 一 个 切换 。 注意 到 此 时 为 止 ， 移 动用 户 完 全 不 知 网 络 
已 经 为 切换 做 好 所 有 底层 工作 ( 如 在 新 BS 中 分 配 一 个 信道 ， 分 配 一 条 从 被 访问 MSC 到 新 
BS FABRE) - 

6) 移动 用 户 和 新 BS 交换 一 个 或 多 个 报 文 ， 以 完全 激活 新 BS 中 新 的 信道。 

7) 移动 用 户 加 新 BS 发 送 一 个 切换 完成 报 文 ， 该 报 文 随后 同上 转发 给 被 访问 MSC, 
该 被 访问 MSC 然后 重 路 由 选择 到 移动 用 户 的 正在 进行 的 呼叫 ， 使 其 经 过 新 BS. 

8) 沿 者 到 旧 BS 的 路 径 分 配 的 资源 随后 被 释放 o 

通过 考虑 如 下 情况 来 总 结 我 们 对 切换 的 讨论 : 当 移 动用 户 移 动 到 一 个 不 同 于 I 卓 BS AY, 
与 不 同 的 MSC 关联 的 BS 中 时 ， 并 且 当 这 种 MSC 之 间 的 切换 多 次 发 生 时 ， 考 虑 这 些 情况 下 
将 发 生 什 么 。 如 图 6-32 所 示 ，CSM X T MSC (anchor MSC) 的 概念 。 销 MSC 是 呼叫 
首次 开始 时 移动 用 户 所 访问 的 MSC， 它 因此 在 整个 呼叫 持续 过 程 中 保持 不 变 。 在 整个 呼叫 
持续 期 间 ， 不 论 移动 用 户 进 行 了 多 少 次 MSC 间 转 换 ， 呼 叫 总 是 从 归属 MSC 路 由 选择 到 销 
MSC， 然 后 再 到 移动 用 户 当 前 所 在 的 被 访问 MSC， 当 移动 用 户 从 一 个 MSC 覆盖 区 到 达 男 
一 个 MSC 履 盖 区 后 ， 正 在 进行 的 呼叫 被 重 路 由 选择 ， 从 锚 MSC 到 包含 新 基站 的 新 被 访问 
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MSC。 因 此 ， 在 任何 情况 下 ， 通 信者 和 移动 用 户 之 间 至 多 有 3 个 MSC (归属 MSC, fj MSC 
以 及 被 访问 MSC) 图 6-32 图 示 了 在 移动 用 户 所 访问 的 MSC 之 间 的 一 个 呼叫 的 路 由 选择 . 


归属 网 络 通信 者 归属 网 络 通信 者 


cm gp 
+ 


ie g 





a) 切换 前 
图 6-32 Milta MSC 重 路 由 选择 


一 种 方法 则 不 用 维持 从 氏 MSC 到 当前 MSC 的 单一 MSC 跳 ， 将 直接 链接 移动 用 户 访 

DES masa 每 当 移 动用 户 移 到 一 个 新 MSC 后 ， 让 旧 MSC pa 进行 的 呼叫 转发 给 新 

MSC。 这 种 MSC 链 事 实 上 能 够 出 现在 IS-41 蜂窝 网 络 中 ， 通 过 使 用 最 少 步 又 的 可 选 路 径 来 
FRE MSC 和 当前 访问 MSC 之 间 的 MSC [ Lin 2001 ]. 

下 面 通过 对 比 GSM rir P 中 的 移动 性 管理 ， 来 完成 我 们 对 GSM 移动 性 管理 的 讨 

， 表 6-2 中 的 对 比 指 E IP 和 蜂窝 网 络 在 很 多 方面 有 很 大 的 区 别 ， 但 它们 共享 数量 

st et, 总 体 方法 。 
表 6-2 移动 IP 和 GSM 移动 性 之 间 的 共性 
GSM 要 素 对 GSM 要 素 的 解释 移动 IP 要素 
归属 系统 移动 用 户 永久 电话 号 码 所 归属 的 网 络 归属 网 络 


上 归属 MSC: 获取 移动 用 户 路 由 地 址 的 联系 点 。HLR : 
pa be Ph 包含 移动 用 户 永 久 电 话 号 码 、 个 人 信息 、 归属 代理 
当前 位 置 和 订购 信息 的 数据 库 


网 关 移 动 (服务 ) 交换 中 心 或 简称 
归属 MSC, Wai yess (HLR) 





被 访问 系统 移动 用 户 当前 所 在 的 非 归 属 系统 网 络 波 访 网 络 
aa (IRE) Aakers: | ”被 访问 MSC: 负责 建立 与 MSC 相关 联 的 发 射 区 中 到 / 


被 访问 MSC， 访 问 者 定位 记录 (YLR) 


项 ， 包 含 每 个 访问 移动 用 户 的 订购 信息 


移动 站 点 漫游 号 码 (MSRN ) 18 用 于 归属 MSC 和 被 访问 MSC 之 间 电 话 呼 叫 的 路 由 地 转交 地 二 
游 号 码 上 ， 对 移动 用 户 和 通信 者 均 不 可 见 





6.8 无 线 和 移动 性 : 对 高 层 协议 的 影响 


在 本 草 中 ， 我 们 已 经 看 到 了 无 线 网 络 在 链 路 层 ( 由 于 无 线 信道 的 诸如 衰减 、 多 径 、 隐 
Zong Se FEE) 和 网 络 层 (由 于 移动 用 户 改 变 与 网 络 的 连接 点 ) 与 有 线 网 络 的 对 应 物 有 重 
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ae 但 在 运输 层 和 应 用 层 是 否 也 有 重大 差别 呢 ?” 我 们 很 容易 认为 这 些 差 别 是 很 小 
， 因 为 在 有 线 和 无 线 网 络 中 的 网 络 层 均 为 上 层 提 供 了 同样 的 尽力 而 为 服务 模式 。 类 似 
如 果 在 有 线 和 无 线 网 络 中 都 是 使 用 诸如 TCP 和 UDP 的 协议 提供 运输 层 服 务 ， 那 么 应 
HJ UART E B ARRS 是 对 的 ， 即 TCP 和 UDP 可 以 (也 确实 ) 运 
行 在 有 具有 无 线 链 路 的 网 络 中 。 在 另 一 方面 ， 运 输 层 协议 CRP TCP) 通常 在 有 线 和 无 线 
网 络 中 有 时 会 有 完全 不 同 的 性 能 。 这 里 ， 在 性 能 方面 区 别 是 明显 的 ， 我们 来 研究 一 下 其 中 
的 原因 
前 面 计 过， 在 发 送 方 和 接收 方 之 间 的 路 径 上 ， 一 个 报 文 段 不 论 是 丢失 还 是 出 错 ，TCP 
孝 将 重 传 它 。 在 移动 用 户 情 况 下 ， 丢失 可 能 源 于 网 络 拥塞 (路 申 融 缓存 液 出 ) 或 者 切换 
(例如 ， 由 于 重 路 由 选择 报 文 段 到 移动 用 户 新 的 网 络 接 人 点 引入 的 时 延 ) 。 在 所 有 情况 下 ， 
TCP 的 接收 方 到 发 送 方 的 ACK rei E 完整 的 报 文 段 ， 发 送 方 并 不 知道 
报 文 段 是 由 于 拥 赛 ， 或 在 切换 过 程 中 ， 是 由 于 检测 到 比特 差错 而 被 丢弃 的 。 在 所 有 情况 
lie eae i thao it ert treeh aE 
的 ， 即 TCP 减 小 其 拥塞 窗口 ， 如 3.7 节 讨 论 的 那样 。 由 于 无 条 件 地 降低 其 拥塞 窗口 TCP 
隐 含 地 假设 报 文 段 丢 失 是 由 于 拥塞 而 非 出错 或 者 切换 所 致 。 我 们 在 6. 2 市 看 到 ， 在 无 线 网 
络 中 比特 错误 比 在 有 线 网 络 中 普遍 得 多 。 当 这 样 的 比特 差错 或 者 切换 丢失 发 生 时 ， 没 理由 
让 TCP 发 送 方 降低 其 拥塞 窗口 〈 并 因此 降低 发 送 速率 ) 。 此 时 路 由 硕 的 缓存 的 确 可 能 完 
是 空 的 ， 分 组 可 以 在 端 到 端 链 路 中 丝 坚 不 受 拥 案 阻碍 地 流动 .。 
研究 人 员 在 20 世纪 90 年 代 早期 到 中 期 就 认识 到 ， 由 于 无 线 信道 的 高 比特 差错 率 和 切 
fe FRAT EXE, TCP 的 拥塞 控制 反应 在 无 线 情况 下 可 能 会 有 问题 。 有 三 大 类 可 能 的 方法 
用 于 处 理 这 一 问题 : 
© 本 地 恢复 。 本 地 恢复 方法 的 目标 是 在 比特 差错 出 现 的 当时 和 当地 (如 在 无 线 链 路 
中 ) 将 其 恢复 。 如 在 6. 3 节 学 习 的 802. 11 ARQ 协议 ， 或 者 使 用 ARQ 和 FEC 的 更 
为 复杂 的 方法 | Ayanoglu 1995 | ) 。 
© TCP 发 送 方 知晓 无 线 链 路 ， 在 本 地 恢复 方法 中 ，TCP 发 送 方 完 全 不 清楚 其 报 文 段 
跨越 一 段 无 线 链 路 。 另 一 种 方法 是 让 TCP 发 送 方 和 接收 方 知道 无 线 链 路 的 存在 ， 
从 而 将 在 有 线 网 络 中 发 生 的 拥塞 性 于 包 和 在 无 线 网 络 中 发 生 的 差错 / 丢 包 区 分 开 ， 
并 且 仅 对 有 线 网 络 中 的 拥塞 性 丢 包 采用 拥塞 控制 。 在 假设 闪 系 统 能 够 做 出 这 种 区 
分 的 情况 下 ，| Balakrishnan 1997] 详细 研究 了 多 种 类 型 的 TCP. [ Liu 2003] 研究 
六 在 一 个 端 到 站 路径 中 区 分 有 线 部 分 丢 包 和 无 线 部 分 丢 包 的 技术 ， 
© 分 离 连接 方法 。 在 分 离 连 接 方法 中 [ Bakre 1995 | ， 移 动用 户 和 其 他 痛 点 之 间 的 端 
到 冰 连 接 被 打 断 为 两 个 运输 层 连接 : 一 个 从 移动 主机 到 无 线 接 入 点 ,一 个 从 无 线 
接 入 点 到 其 他 通信 端点 (我们 假定 它 是 有 线 的 主机 ) ,该 绒 到 尊 连 接 因 此 是 由 一 个 
无 线 部 分 和 一 个 有 线 部 分 级 连 形成 的 。 经 无 线段 的 运输 层 能 够 是 一 个 标准 的 TCP 
连接 [Bakre 1995 ] ， 或 是 一 个 特别 定制 运行 在 UDP 上 的 差错 恢复 协议 。[ Yavatkar 
1994) 研究 了 经 无 线 连接 使 用 运输 层 选择 性 重 传 协 议 。 在 [Wei 2006] 中 的 测量 
报告 指出 了 分 离 TCP 连接 广泛 用 于 蜂 需 数据 网 络 中 ， 通 过 使 用 分 离 TCP 连接 ， 上 
述 问 题 的 确 能 够 有 很 大 改进 。 
我 们 这 里 有 关 无 线 链 路 上 的 TCP 的 讨论 是 十 分 简要 的 。 在 无 线 网 络 中 有 关 TCP 挑战 
和 解决 方案 的 深入 展望 能 够 在 [ Hanabali 2005; Leung 2006] 中 找到 。 我 们 鼓励 读者 去 查 
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阅 这 些 文献 以 了 解 这 个 正在 进行 的 研究 领域 的 详情 

考虑 过 运输 层 协议 后 ， 我 们 接 下 来 考虑 无 线 和 移动 性 对 应 用 层 协议 的 影响 、 这 里 一 个 
重要 的 考虑 是 无 线 链 路 经 常 具 有 相对 较 低 的 带宽 ， 如 我 们 在 图 6-2 中 所 见 。 因 此 ， 运 行 在 
无 线 链 路 尤其 是 蜂 帘 无 线 链 路 上 的 应 用 程序 ， 必 须 将 带宽 作为 种 有 物品 对 待 。 例 如 ， 一 个 
为 在 3G 电话 上 运行 的 Web WW ae HEAR AY Web 服务 带 ， 就 不 能 像 为 运行 在 有 线 连接 的 
浏览 部 那样 提供 含有 大 量 几 片 的 内 容 。 尽 管 无 线 链 路 的 人 销 为 应 用 层 提 出 一 些 挑战 ， 它 们 县 
有 的 移动 性 同样 使 得 一 大 批 位 置 知 晓 和 环境 知晓 应 用 成 为 可 能 [ Chen 2000; Baldauf 
2007 ] 。 更 一 般 地 ， 无 线 和 移动 网 络 将 在 未 来 的 泛 在 计算 环境 实现 中 起 着 重要 作用 [ Weiser 
1991 | 。 显 然 ， 在 谈 及 无 线 和 移动 网 络 对 网 络 应 用 及 其 协议 的 影响 时 ， 公 平 而 论 我 们 仅 看 
到 了 冰山 一 角 ! 


6.9 Whe 


无 线 网 络 和 移动 网 络 使 电话 发 生 了 了 羊 命 性 变化 ， 同 时 也 对 计算 机 网 络 界 产生 了 日益 次 
远 的 影响 。 伴 随 着 它们 对 全 球 网 络 基础 设施 的 随时 、 随 地 、 无 缝 地 接 入 ， 它 们 不 仅 使 网 络 
接 人 变 得 更 加 无 所 不 在 ， 而 且 催生 了 一 组 新 的 、 令 人 兴奋 的 位 置 相 关 服 务 。 考 虑 到 无 线 网 
络 和 移动 网 络 不 断 增 长 的 重要 性 ， 本 童 关 注 用 于 文 持 无 线 和 移动 通信 的 上 原理、 通用 链 路 技 
本 以 及 网 络 体系 结 构 。 

本 章 以 对 无 线 网 络 和 移动 网 络 的 介绍 开始 描述 了 由 这 种 网 络 中 通信 和 链 跨 的 无 线 特性 
所 引发 的 挑战 和 由 这 些 无 线 链 路 带 来 的 移动 性 之 间 的 重要 区 别 。 这 使 我 们 能 够 更 好 地 区 
分 、 识 别 和 掌握 每 个 领域 中 的 关键 概念 。 我 们 首先 关注 无 线 通 信 ， 在 6.2 节 中 考虑 了 无 线 
链 路 的 特征 。 在 6.3 节 和 6.4 节 中 ， 我们 人 研究 了 IEEE 802.11 (Wiki) 无 线 LAN 标准 、 两 
个 IEEE 802. 15 个 人 区 域 网 络 (蓝牙 和 ZigBee)， 以 及 3G 和 4G 蜂 鹤 因 特 网 接 入 .然后 我 
们 将 注意 力 转 向 移动 性 问题 。 在 6.5 节 中 我 们 区 分 了 多 种 形式 的 移动 性 ， 不 同 的 移动 性 面 
临 不 同 的 挑战 并且 看 到 了 不 同 的 解决 方案 。 我 们 考虑 了 移动 结 和 点 的 定位 和 中 由 选择 问 
题 ， 以 及 对 那些 动态 地 从 一 个 网 络 接 入 点 移 到 为 一 个 网 络 接 入 点 的 移动 用 户 的 切换 问题 ， 
在 6.6 节 和 6.7 FT, 我们 分 别 考察 了 这 些 问题 在 移动 IP 标准 和 GSM 中 是 如 何 处 理 的 . 
最 后 ， 我 们 在 6. 8 节 中 考虑 了 无 线 链 路 和 移动 性 对 运输 层 协议 和 网 络 应 用 的 影响 . 

尽管 我 们 用 了 整整 一 章 来 学 习 无 线 网 络 和 移动 网 络 ， 但 全 面 探索 这 个 令 人 兴奋 和 快速 
扩展 的 领域 需要 一 整 本 书 或 更 多 书 的 篇 幅 。 我 们 鼓励 读者 通过 查阅 在 本 草 中 提供 的 许多 参 
考 资料 ， 对 这 一 领域 进行 更 深入 的 人 研究 ， 


课 后 习题 和 问题 





6. 1 节 
Rl. 一 个 无 线 网 络 运行 在 “基础 设施 模式 ”下 是 什么 含义 ? 如 果 革 网 络 没有 运行 在 基础 设施 模式 下 ， 那 
么 它 运 行 在 什么 模式 下 ? 这 种 运行 模式 与 基础 设施 模式 之 间 有 什么 不 同 ? 


R2. 在 6.1 和 节 的 分 类 法 中 ， 所 确定 的 四 种 无 线 网 络 类 型 各 是 什么 ? 你 已 经 使 用 的 是 这 些 无 线 网 络 类 型 中 
的 哪 一 种 ? 
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R3. 下 列 类 型 的 无 线 信道 损伤 之 间 有 什么 区 别 : 路 径 损 耗 、 多 径 传 播 、 来 目 其 他 源 的 干扰 ? 

R4. 随 着 移动 结 点 离开 基站 越 来 越 远 ， 为 了 保证 传送 巾 的 丢失 概率 不 增加 ， 基 站 能 够 采取 的 两 种 措施 是 
FA? 

6.3-6.4 

R5. 描述 802. 11 中 信 标 帧 的 作用 . 

Ro. FETE FIM: 802. 11 站 在 传输 一 个 数据 帧 前 ， 必 须 首先 发 送 一 个 RTS 帧 并 收 到 一 个 对 应 的 CTS 帧 。 

R7. 为 什么 802. 11 中 使 用 了 确认 ， 而 有 线 以 太 网 中 却 未 使 用 ? 

RS. JEZIK: 以 太 网 和 802. 11 使 用 相同 的 帧 格式 。 

R9. 描述 RTS 门限 值 的 工作 过 程 。 

R10. 假设 IEEE 802. 11 RTS Al CTS 帧 与 标准 的 DATA 和 ACK 帧 一 样 长 ， 使 用 CTS 和 RTS 帧 还 会 有 好 处 
吗 ? 为 什么 ? 

R11.6.3.4 节 讨 论 了 802. 11 移动 性 ， 其 中 无 线 站 点 从 一 个 BSS 到 同一 子 网 中 的 男 一 个 BSS。 当 AP 是 通 
过 交换 机 互 连 时 ， 为 了 让 交换 机 能 适当 地 转发 帧 ， 一 个 AP 可 能 需要 发 送 一 个 市 有 哄骗 的 MAC 地 址 
的 帧 ， 为 什么 ”? 

R12. 在 某 蓝牙 网 络 中 的 一 个 主 设 备 和 在 802. 11 网 络 中 的 一 个 基站 之 间 有 什么 不 同 ? 

R13. 在 802. 15.4 ZigBee 标准 中 超级 帧 的 含义 是 什么 ? 

R14. 在 3G 蜂 祷 数据 体系 结构 中 ,“ 核 心 网 ”的 作用 是 什么 ? 

RIS. 在 3G 蜂窝 数据 体系 结构 中 ，RNC 的 作用 是 什么 ”在 蜂 需 语音 网 中 RNC 起 什么 作用 ? 

6.5-6.6 # 

R16. 如 果 某 结 点 与 因特网 具有 无 线 连 接 ， 则 该 结 点 必定 是 移动 的 吗 ?” 试 解释 之 假设 一 个 使 用 膝 上 型 电 
闹 的 用 户 携带 电脑 绕 着 她 的 住所 散步 ， 并 且 总 是 通过 相同 的 接 人 点 接 人 因特网 。 从 网 络 的 角度 看 ， 
RIERA AM? DHE 

R17. 永久 地 址 与 转交 地 址 之 间 的 区 别 是 什么 ?” 谁 指派 转交 地 址 ? 

R18. 考虑 经 移动 IP 的 一 条 TCP 连接 ,是 非 判 断 : 在 通信 者 和 移动 主机 之 间 的 TCP 连接 阶段 经 过 该 移动 
用 户 的 归属 网 络 . 但 数据 传输 阶段 直接 通过 该 通信 者 和 移动 主机 ， 绕 开 了 归属 网 络 ， 

6.7 节 

R19. 在 GSM 网 络 中 ，HLR Al VLR 的 目的 是 什么 ”移动 IP 的 什么 要 素 类 似 于 HLR A VLR? 

R20. 在 GSM 网 络 中 ， 锚 MSC 的 作用 是 什么 ? 

6.8% 

R21. 为 了 避免 单一 无 线 链 路 降低 一 条 端 到 端 运输 层 TCP 连接 的 性 能 ， 能 够 采取 的 三 种 方法 是 什么 ? 


Z 3a 


Pl. 考虑 在 图 6-5 中 单一 发 送 方 的 CDMA 例子 。 如 果 发 送 方 的 CDMA 码 是 (1, -1, 1, -1, 1, -1, 
1，-1)， 那 么 其 输出 〈 对 于 所 显示 的 两 个 数据 比特 ) 是 什么 ? 

P2. FEA 6-6 中 的 发 送 方 2， 发 送 方 对 信道 Z , 的 输出 是 什么 〈 在 它 被 加 到 来 自发 送 方 1 的 信号 前 )? 

P3. 假设 在 图 6-6 中 的 接收 方 布 望 接收 由 发 送 方 2 发 送 的 数据 。 说 明 通 过 使 用 发 送 方 2 的 代码 ，( 经 计 
算 ) 接收 方 的 确 能 够 将 发 送 方 2 的 数据 从 聚合 信道 信号 中 恢复 出 来 。 

P4. 在 两 个 发 送 方 、 两 个 接收 方 的 场合 ， 给 出 一 个 包括 和 -1 值 的 两 个 CDMA 编码 的 例子 ， 不 允许 两 个 
接收 方 从 两 个 CDMA 发 送 方 提取 出 初始 传输 的 比特 。 

PS. 假设 有 两 个 ISP 在 一 个 特定 的 咖啡 馆 内 提供 WiFi 接 入 ， 并且 每 个 1SP 有 其 自己 的 AP Al IP 地址 块 。 
a. 进一步 假设 ， 两 个 ISP 都 意外 地 将 其 AP 配置 运行 在 信道 11。 在 这 种 情况 下 ，802. 11 协议 是 否 将 

完全 崩溃 ?讨论 一 下 当 两 个 各 上 自 与 不 同 ISP 相关 联 的 站 点 试图 同时 传输 时 ， 将 会 发 生 什 么 情况 ， 


P6. 


P8. 


.假设 一 个 802.11b 站 点 被 配置 为 始终 使 用 RTS/CTS 序列 预约 信道 .假设 该 结 点 突然 要 发 送 1000 F 
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b. 现在 假设 一 个 AP 运行 在 信道 1 ， 而 另 一 个 运行 在 信道 11。 你 的 答案 将 会 有 什么 变化 ” 

在 CSMA/CA 协议 的 第 4 步 ， 一 个 成 功 传输 一 个 帧 的 站 点 在 第 2 步 (而 非 第 1 步 ) 开始 CSMA/CA 协 
iM. 通过 不 让 这 样 一 个 站 点 立即 传输 第 2 个 帧 (即使 侦 听 到 信道 空间 ) CSMA/CA 的 设计 者 是 基于 
原理 来 考虑 的 呢 ? 


lie. 并 旦 所 有 其 他 站 点 此 时 都 是 空 亲 的 .作为 SIFS 和 DIFS fy pC, FP ZR RE aE, BOC LL 

HEE. TER ACK KO AA BU A is ZEA ET Ti] o 

FE (EE 6-33 中 显示 的 情形 ， 其 中 有 四 个 无 线 结 点 A, B, CAD, GPU SA RY OCA E A he E tie as 

为 其 中 的 椭圆 型 阴影 ; 所 有 结 点 共享 相同 的 频率 ， 当 A 传输 时 ， 仅 有 B 能 听 到 /接收 到 ; B 传输 时 ， 

A ALC 能 听 到 /接收 到 ; 当 C 传输 时 ，B 和 了 能 听 到 /接收 到 ;， 当 D 传输 时 ， 仅 有 C 能 听 到 /接收 到 ， 

假定 现在 每 个 结 点 都 有 无 限 多 的 报 文 要 向 每 个 其 他 结 点 发 送 。 如 果 一 个 报 文 的 目的 地 不 是 近 祁 、 

则 该 报 文 必须 要 中 继 ， 例 如 ， 如 果 A 要 向 DD 发送 ,来自 A 的 报 文 必须 fE B, B 再 将 该 报 文 发 

送 给 C、C 则 下 将 其 发 向 DT) EP Bat, TR Scr Ay fa TE aE ON PEA BE Aloha 

PAIR w — E TE BP, GEOR 9 TE —: (i) 发 送 一 个 报 文 (如果 它 有 报 文 回 D 

转发 ); Gi) 接收 一 个 报 文 (如 果 正 好 一 个 报 文 要 向 它 发 送 ) Gi) 保持 静默 。 如 同 通 第 情况 那样 ， 

如 果 一 个 结 点 听 到 了 两 个 或 更 多 的 结 点 同时 发 送 、 出现 冲突 ， 并 且 重 传 的 报 文 没有 一 个 能 成 功 收 到 

你 这 时 能 够 假定 没有 比特 级 的 差错 ， 因 此 如 果 正 好 只 有 一 个 报 文 在 发 送 ， 它 将 被 位 于 发 送 方 传输 半 

径 之 内 的 站 点 正确 收 到 。 

a 现在 假定 一 个 无 所 不 知 的 控制 器 即 一 个 知道 在 网 络 中 每 个 结 点 状态 的 控制 融 ) 能 够 命令 每 个 结 
点 去 做 它 〈 无 所 不 知 的 控制 器 ) 布 望 做 的 事情 ， 例 如 发 送 报 文 ， 接 收报 文 ， 或 保持 静默 。 给 定 这 
种 无 所 不 知 的 控制 器 ， 数 据 报 文 能 够 从 C 到 A 传输 的 最 大 速率 是 什么 ， 假 定 在 任何 其 他 源 “ 目 的 
地 对 之 间 没 有 其 他 报 文 ? 

b. 现在 假定 A le] B 发 送 报 文 ， 并 日 DD 向 C 发 送 报 文 。 数据 报 文 能 够 从 A 到 B 生 从 DD 到 C 流动 的 组 
合 最 大 速率 是 多 少 ? 

(现在 Bee A 向 B 发送 报 文 且 C 向 DD AREA SC. 数据 报 文 能 够 从 A 到 B 且 从 C 到 D 流 动 的 组 合 
Kid Wp? 

d. die 无 线 链 踏 由 有 线 链 路 代替 .在 此 情况 下 ， 重 复 问 题 (a) ~ (e)s 

e 现在 假定 我 们 又 在 无 线 状 态 下 ， 对 于 从 源 到 目的 地 的 每 个 数据 报 文 ， 目的 地 将 癌 源 回 送 一 个 ACK 
fi sc (例如 ， 如同 在 TCP 中 )。 对 这 种 情况 重复 问题 (a) ~ (e), 





图 6-33 习题 P8 的 情形 


PO. 描述 802. 15. 1 蓝牙 帧 的 格式 .你 必须 要 阅读 某 些 课外 读物 来 获取 这 些 信息 : 在 帧 格式 中 有 哪些 央 系 


PIO. 


本 质 上 会 限制 802. 15.1 网 络 中 主动 纺 点 数量 为 8 呢 ? RREZ . 

E FIJE EAI LTE 情形 .下行 信道 (参见 图 6-20) 划分 为 时 际 , 使 用 了 下 个 频率 。 有 4 个 结 
点 AA、B、C AID 分 别 以 10Mbps、5Mbps、2.5Mbps 和 1Mbps 速率 在 下 行 信 道上 可 到 达 基 站 。 这 些 速 
率 假定 基本 在 所 有 严 个 频率 上 能 够 利用 所 有 时 隙 只 癌 一 个 站 点 进行 发 送 . 基站 具有 无 限量 的 数据 回 
每 个 结 点 发 送 ， 并 且 在 下 行 子 帧 中 的 任何 时 院 期 间 使 用 天 个 频率 中 的 任何 之 一 能 够 向 这 4 个 站 点 之 

一 发 送 ， 
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Pil, 


PZ. 


PIS: 


P14. 


P15. 


P16. 





a. 假定 基站 在 每 个 时 际 期 间 能 够 回 它 选择 的 任何 结 点 发 送 ， 它 能 同 结 点 发 送 的 最 大 速率 是 多 少 ” 你 
的 解决 方案 公平 吗 ” 解 释 并 定义 你 所 指 “ 公 平 ” 的 含义 。 

b 如果 有 公平 要 求 ， 即 每 个 站 点 在 每 秒 期 间 必 须 收 到 等 量 的 数据 ， 在 下 行 子 帧 期 间 基 站 (向 所 有 
结 点 ) 的 平均 传输 速率 是 多 少 ? 

c 假定 该 公平 性 准则 是 在 子 帧 期 间 任 何 结 点 至 多 能 够 接收 任何 其 他 结 点 两 倍 多 的 数据 :在 下 行 子 帧 
期 间 基 站 〈 回 所 有 结 点 ) 的 平均 传输 速率 是 多 少 ? 解释 你 是 如 何 得 到 答案 的 

在 6.5 节 ， 一 种 允许 移动 用 户 在 外 部 网 络 间 移 动 过程 中 保持 其 下 地 址 不 变 的 建议 方案 是 ， 让 外 部 网 

络 通告 一 个 到 该 移动 用 户 高 度 特定 的 路 由 ， 并 使 用 现 有 的 路 由 选择 基础 设施 在 整个 网 络 中 传播 这 一 

言 息 。 我 们 将 扩展 性 作为 一 种 关注 因素 。 假 设 移 动用 户 从 一 个 网 络 移动 到 另 一 个 网 络 后 ， 新 的 外 部 

网 络 通 告 一 个 到 移动 用 户 的 特定 路 由 ， 旧 的 外 部 网 络 丢 弃 其 路 由 .考虑 路 由 信息 如 何在 一 个 距离 问 

量 算 法 中 传播 (尤其 是 对 于 跨越 全 球 的 网 络 间 的 域 间 路 由 选择 情况 ) ， 

a 一 旦 外 部 网 络 开 始 通告 其 路 由 ， 其 他 路 由 需 能 否 立 刻 将 数据 报 路 由 选择 到 新 的 外 部 网 络 呢 ? 

b. 不 同 的 路 由 顺 有 可 能 认为 移动 用 户 位 于 不 同 的 外 部 网 络 中 吗 ? 

c 讨论 网 络 中 其 他 路 由 融 最 终 知 道 到 达 移 动用 户 的 路 径 所 用 的 时 间 范 围 ， 

假设 图 6-22 中 通信 者 是 移动 的 ,概述 为 了 将 数据 报 从 初始 移动 用 户 路 由 选择 到 (现在 移动 的 ) 通 

信者 所 需要 的 额外 的 网 络 层 基础 设施 。 如 图 6-23 中 那样 ， 显 示 在 初始 移动 用 户 和 (现在 移动 的 ) 

通信 者 之 间 数 据 报 的 结构 . 

在 移动 IP 中 ， 移 动 性 将 对 数据 报 在 源 和 日 的 地 间 的 端 到 端 时 延 有 怎样 的 影响 ? 

5E 6.7.2 节 最 后 讨论 的 链 的 例子 。 假设 一 个 移动 用 户 访 问 外 部 网 络 A、B 和 C， 当 通信 者 在 外 部 

网 络 A 中 时 ， 它 开始 一 条 与 移动 用 户 的 连接 。 列 出 在 外 部 代理 之 间 和 外 部 代理 与 归属 代理 之 间 ， 当 

移动 用 户 从 网 络 A 到 网 络 B 再 到 网 络 C 的 过 程 中 的 报 文 序列 。 然后， 假设 未 执行 链接 ， 并 且 通 信者 

(以 及 归属 代理 ) 必须 被 显 式 地 告知 移动 用 户 转交 地 址 的 改变 列 出 在 第 二 种 情况 下 需要 交换 的 报 

文 序列 。 

考虑 在 一 个 具有 人 外 部 代理 的 外 部 网 络 中 的 黄 个 移动 结 点 。 在 移动 IP 中 ， 这 两 个 移动 结 点 是 否 可 能 

使 用 相同 的 转交 地 址 ? 解释 你 的 答案 。 

在 我 们 对 VLR 如 何 用 移动 用 户 当 前 位 置信 息 更 新 HLR 的 讨论 中 , 与 VLR 地 址 对 HLR 相 比 ， 提 供 

MSRN 所 具有 的 优 和 缺点 各 是 什么 ? 


制 Wireshark 实验 


实验 ， 





在 本 书 的 配套 Web 站 点 上 Chttp://www. awl. com/kurose-ross) ， 你 将 会 找到 有 关 本 章 的 一 个 Wireshark 
该 实验 用 于 捕获 和 学 习 在 无 线 便携 机 和 接 入 点 之 则 交换 的 802. 11 ii. 


| 人物 专 访 


Deborah Estrin 是 加 州 大 学 洛 棚 矶 分 校 的 计算 机 科学 教授 ,计算 机 网 络 的 


Jon Postel 主席 ， 餐 入 式 网 络 感 知 中 心 (CENS) 的 主任 以 及 非 营 利 组 织 open- 
mhealth. org 的 联合 奠基 人 ， 她 从 MIT 获得 了 计算 机 科学 博士 学 位 (1985 年 )， 
从 加 州 大 学 伯克利 分 校 获得 硕士 学 位 (1980 年 ) Estrin 的 早期 研究 集中 在 包 
括 多 播 和 域 间 路 由 选择 等 在 内 的 网 络 协议 的 设计 .， 在 2002 年 ，Estrin 创建 了 美 
国家 自然 科学 基金 资助 的 科学 技术 中 心 CENS (http:/cens. ucla. edu) ， 以 研 
发 和 探索 环境 监视 技术 和 应 用 .当前 Estrin 及 其 同事 正在 研发 供 人 分 享 感 知 
(participatory sensing) 系统 ， 促 进 移动 电话 的 可 编程 能 力 、 邻 近 性 和 泛 在 性 的 
发 展 ; 基本 部 署 环境 是 移动 健康 (http://openmhealth. org) 、 社 区 数据 收集 和 
STEM X Å (http://mobilizinges. org) , Estrin 教授 是 美国 艺术 和 科学 研究 院 





Deborah Estrin 
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(2007 年 ) 和 国家 工程 院 (2009 +) 的 当选 成 员 ， 她 是 IEEE, ACM 和 AAAS 的 会 士 。 她 被 选 
为 首 名 ACM-W 雅典 娜 讲师 (2006 年 )， 获 得 Anita Borg 学 院 的 妇女 远见 创新 奖 (2007 年 )， 被 
引入 WIT] 名 人 纪念 馆 (2008 年 ) 和 获得 来 自 EPFL (2008 年 ) 和 Uppsala 大 学 (2011 年 ) 的 
Honoris Causa 博士 . 


o 请 描述 在 您 的 职业 生涯 中 从 事 的 几 件 最 为 令 人 兴奋 的 项 目 ? 

20 titu 90 年 代 中 期 当 我 在 USC 和 SI 的 时 候 ， 非 常 荣 辛 地 与 像 Steve Deering, Mark Handley 和 Van 
Jacobson 这 样 的 人 物 在 一 起 工作 ， 设 计 多 播 路 由 选择 协议 (特别 是 PIM ) 我 坛 图 将 多 播 体系 结构 设计 中 
的 许多 经 验 教训 借鉴 到 生态 监视 阵列 中 ， 这 是 我 首次 真正 开始 全 映 心 地 进行 应 用 和 多 学 科 的 研究 。 那 让 
我 对 社会 和 技术 领域 中 的 创新 感 兴趣 ， 它 们 激发 我 对 近期 的 研究 领域 一 一 移动 健康 的 研 究 兴趣 。 这 些 项 
日 中 的 挑战 随 问 题 领域 不 同 而 不 同 ， 但 它们 的 共同 之 处 是 需要 睁 大 我 们 的 眼睛 ， 当 我 们 在 设计 、 部 莹 、 
制作 原型 和 试用 之 间 重 复 时 关注 对 问题 的 定义 是 否 正 确 。 没 有 一 个 问题 能 够 借助 于 异 拟 或 者 构造 的 实验 
室 实验 加 以 分 析 解 决 。 面 对 凌乱 的 问题 和 环境 要 保持 清晰 的 体系 结构 ， 它 们 部 对 我 们 的 能 力 提出 挑战 ， 
并 且 它 们 都 需要 广泛 的 协作 。 

e 未 来 在 无 线 网 络 和 移动 性 方面 您 预见 将 会 发 生 什 么 变化 和 创新 ? 

我 从 来 对 预测 未 来 不 有 具 太 多 信心 ， 但 是 随 着 智能 手机 变 得 越 来 越 强 大 和 因特网 基本 接 和 人 点 增多 .我 
预言 我 们 可 能 看 到 特色 电话 〈( 即 那些 不 可 编程 和 仅 能 用 于 语音 和 文本 信息 的 电话 ) 的 终结 . 我 还 认为 我 
们 将 看 到 小 入 式 SIM 的 继续 迅速 增长 ， 各 种 设备 通过 让 入 式 SIM 具有 经 过 蜂窝 网 络 以 低 数据 率 通信 的 
能 力 . 

e 您 预见 网 络 和 因特网 的 未 来 回 何 处 发 展 ?” 

在 命名 数据 和 软件 定义 网 络 方面 的 努力 将 出 现成 果 , 产生 更 可 管理 、 可 演化 和 更 丰富 的 基础 议 施 ， 
以 及 更 一 般 地 表现 为 推动 体系 结构 的 责任 向 协议 栈 较 高 层 发 展 . 在 因特网 开始 时 ， 体 系 结构 包括 第 四 层 
及 以 下 ， 位 于 顶端 的 应 用 程序 更 为 竖井 式 / 独 块 式 的 。 现 在 则 是 数据 和 分 析 文 配 有 传输 

© 什么 人 对 于 您 的 职业 生涯 给 予 了 激励 ? 

有 三 个 人 出 现在 我 的 脑海 中 。 第 一 个 人 是 Dave Clark, ， 他 是 因特网 界 的 秘方 和 无 名 英雄 。 早 期 我 有 幸 
在 他 的 左右 ， 看 到 他 在 TAB 的 “组 织 规 范 ” 和 因特网 管理 方法 方面 所 起 的 作用 ， 凤 大 致 共识 和 运行 编 们 
的 引导 者 。 第 二 个 人 是 Scott Shenker， 他 的 智慧 才华 、 正 直 和 坚持 令 我 印象 深刻 。 我 努力 但 很 难 像 他 那样 
清晰 地 定义 问题 和 给 出 解决 方案 。 无 论 问题 大 和 小 ， 我 发 电子 邮件 征求 建议 ， 他 总 是 第 一 个 回复 的 人 。 
第 三 个 人 是 我 的 姐姐 Judy Estrin， 她 将 创造 性 和 勇气 投入 到 她 的 职业 ， 将 想法 和 概念 带 入 市 场 。 没 有 
Judy 这 类 人 ， 因 特 网 技术 将 不 会 改变 我 们 的 生活 。 

o 对 于 希望 从 事 计算 机 科学 和 网 络 职业 的 学 生 ， 您 有 什么 推荐 ? 

首先 ， 在 你 的 学 术 工 作 中 构建 一 个 坚实 的 基础 ， 与 你 能 够 得 到 的 任何 、 每 个 现实 世界 的 工作 经 验 相 
权衡 。 当 你 寻找 一 个 工作 环境 时 ， 在 你 真正 关心 的 问题 领域 寻找 机 会 ， 并 且 参 与 到 你 能 够 从 中 学 习 的 思 
维 敏 捷 的 团队 中 。 
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位 于 世界 各 个 角 沙 的 人 们 当前 正 使 用 因特网 来 按 需 观看 电影 和 电视 节目 。 因 特 网 电影 
和 电视 分 发 公司 (如 北美 的 Netflix 和 Hulu, P AJ “RE” (Youku) 和 “看 看 ” 
(Kankan) ) 实际 上 已 经 成 为 家 喻 户 晓 的 名 称 。 而 人 们 不 仅 观看 因特网 视频 ， 他 们 也 使 用 
诸如 YouTube 这 样 的 站 点 来 上 载 和 分 发 用 户 目 己 生 成 的 内 容 ， 不 仅 成 为 因特网 视频 的 消费 
者 ， 也 成 为 视频 的 生产 者 。 此 外 ， 网 络 应 用 如 Skype, Google Talk 和 QQ (在 中 国 十 分 流 
行 ) ， 不 仅 允 许 人 们 经 过 因特网 打 “ 电 话 ”， 而 且 可 以 用 视频 和 多 方 会 议 来 强化 该 电话 。 
事实 上 ， 我 们 能 够 确定 地 预测 : 到 当前 年 代 未 ， 几 乎 所 有 的 视频 分 发 和 语音 会 话 都 将 在 因 
特 网 的 端 到 端 发 生 ， 通 常 出 现在 经 4G 和 WiFi 接 入 网 与 因特网 连接 的 无 线 终端 上 。 

本 草 以 7.1 刷 中 的 多 媒体 应 用 的 分 类 方法 开始 。 我 们 将 看 到 多 媒体 应 用 能 够 分 为 流 式 
存储 音频 /视频 、 会 话 式 IP 音频 /视频 或 流 式 实况 音频 /视频 等 几 类 。 我们 将 看 到 这 些 应 用 
类 型 中 的 每 一 类 都 有 目 己 独特 的 服务 需求 ， 这 些 需求 与 传统 的 弹性 应 用 如 电子 邮件 、Web 
浏览 和 远程 注册 的 需求 差异 很 大 ,在 7.2 节 中 ， 我 们 较为 详细 地 研究 流 式 视 频 。 我 们 将 探 
讨 支撑 流 式 视频 的 许多 基础 原则 ， 包 括 客户 缓存 、 ep 
我 们 也 将 人 研究 内 容 分 发 网 (Content Distribution Network, CDN), CDN 是 今天 广泛 使 用 的 最 
有 影响 的 流 式 视 频 系 统 。 在 7.3 节 中 ,我 们 研究 会 话 式 语音 和 视频 。 pal 于 弹性 应 
用 ， 对 闪 到 闪 时 延 高 度 敏 感 ， 但 能 够 容忍 偶尔 的 数据 丢失 。 此 时 我 们 将 研究 诸如 适应 性 播 
放 、 前 癌 纠 错 和 差错 掩盖 等 技术 是 如 何 减缓 网 络 引 入 的 丢 包 和 时 延 的 。 我 们 还 将 考察 
Skype 作为 学 习 案 例 。 在 7.4 节 中 ,我 们 将 学 习 RTP 和 SIP， 这 是 两 个 用 于 实时 会 话 式 语 
音 和 视频 应 用 的 协议 。 在 7.5 节 中 ， 我 们 将 研究 网 络 内 部 的 一 些 机 制 ， 这 些 机 制 能 用 于 区 
分 一 类 流量 (如 会 话 式 语音 这 样 的 时 延 敏 感应 用 ) 和 其 他 类 型 流量 (如 浏览 Web 网 页 这 
样 的 弹性 应 用 ) ， 并 且 在 多 类 流量 中 提供 区 分 服务 。 


7.1 多 媒体 网 络 应 用 


我 们 将 多 媒体 网 络 应 用 定义 为 任何 应 用 音频 或 视频 的 网 络 应 用 。 本 小 节 中 ， 我们 将 提 
供 多 媒体 应 用 的 分 类 法 。 我们 将 看 到 在 该 分 类 法 中 的 每 类 应 用 都 具有 自己 独特 的 服务 要 求 
和 设计 问题 集合 。 但 在 深入 讨论 因特网 多 媒体 应 用 前 ， 考 虑 音频 和 视频 媒体 自身 的 内 在 特 
点 是 有 用 的 。 


7.1.1 视频 的 性 质 


视频 最 为 显著 的 特点 或 许 是 它 的 高 比特 率 (high bit rate ) 。 经 因特网 分 发 的 视频 的 典 
型 传输 速率 从 用 于 低 质 量 视频 会 议 的 100kbps 到 用 于 流 式 高 分 辨 率 电影 的 3Mbps。 为 了 比 
较 视 频 市 宽 需求 与 其 他 因特网 应 用 的 带宽 需求 的 不 同 ， 我 们 简要 地 考虑 三 个 不 同 的 用 户 ， 
他 们 每 人 使 用 了 一 种 不 同 的 因特网 应 用 。 第 一 位 用 户 Frank ， 他 打算 迅速 将 照片 张贴 到 他 
的 朋友 的 脸谱 (Facebook) 页 面 上 。 我们 假设 Frank 每 10 秒 钟 查找 一 次 新 照片 ， 并 且 这 些 
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照片 的 平均 大 小 是 200KB。( 与 以 前 一 样 ， 我 们 在 整个 讨论 中 都 向 单 地 假定 LKB = 8000 比 
FF) 第 二 位 用 户 Martha 正 从 因特网 (“z”) 回 她 的 智能 手机 流 式 传输 音乐 。 我 们 假定 
Martha 正在 听 许 多 MP3 ikih, — AiR a, FBLA 128kbps 速率 进行 编 但 。 n 三 位 用 户 
Victor 则 正在 观看 以 2Mbps 编码 的 视频 ， 最后， 我 们 假设 所 有 三 位 用 户 的 会 话 长 度 是 4000 
秒 (大 约 67 分 钟 )- 表 7-1 比较 了 这 三 位 用 户 的 比特 率 和 传输 的 总 字 节 。 我 们 看 到 这 时 流 
oN LTA RE he ae a HE, HFR Ee A i 
aE ta aang a tas Se 

设计 网 络 视 频 应 用 时 ， 我 们 心中 必须 记 住 的 “eee | he a 
"H - 件 事 是 视频 的 高 比特 率 需 求 。 鉴 于 视频 Martha 音乐 | 128kbps ae 
的 流行 性 及 其 高 比特 率 ， 也 许 不 会 对 思科 公 。 “Vicor 视 频 Mbps IGE 
司 以 下 的 预测 感到 惊讶 [Cisco 2011]: 到 了 
2015 年 ， 流 式 视频 和 存储 视频 将 大 约 占 全 球 因 特 网 流量 消费 的 90% . 

视频 的 另 一 种 重要 特点 是 它 能 被 压缩 ， 因 而 要 在 视频 质量 与 比特 率 间 进行 折 中 视频 是 
一 个 图 像 友 列 ， 图 像 通常 以 恒定 的 速率 显示 ,例如 每 秒 24 幅 或 30 幅 图 像 ， 一 个 没有 压缩 、 
数字 编码 的 图 像 由 像素 阵列 组 成 ， 每 个 像素 被 编码 为 一 定数 量 的 比特 来 表示 亮度 和 颜色 ,在 
视频 中 有 两 种 类 型 的 元 余 ， 它 们 都 可 以 用 来 进行 视频 压缩 (video compression), 2 E) 90 4 AE 
给 定 图 像 的 内 部 元 余 。 从 直觉 上 讲 ， ge phn der 
地 压缩 而 不 会 明显 降低 图 像 质 量 。 时 域 宛 余 反 映 一 幅 图 像 和 后 续 图 像 的 重复 程度 。 例 如 ， 
果 一 幅 图 像 和 后 续 图 像 完 全 一 致 ， 没 有 理由 对 后 续 图 像 再 进行 编码 ; 相反 ， eerie 
接 指 出 后 续 图 像 是 完全 一 样 的 则 更 为 有 效 , 今天 商用 的 压缩 算法 能 够 将 视频 压缩 为 所 希望 的 
任何 基本 比特 率 ， 当 然 ， 比 特 率 越 高 ， 图 像 质量 越 好 ， 总 体 用 户 视觉 体验 也 越 好 . 

我 们 也 能 够 使 用 压缩 来 生成 相同 视频 的 多 重 版 本 (multiple version) ， 每 个 版 本 有 不 同 
的 质量 等 级 例如， 我们 能 够 使 用 压缩 生成 相同 视频 的 三 个 版 本 ， 速 率 分 别 为 300kbps、 
I Mbps 和 3Mbps， 几 户 则 能 够 根据 他 们 的 当前 可 用 市 宽 来 决定 要 观看 哪个 版 本 。 有 具有 噩 速 
因特网 连接 的 用 户 可 以 选 搓 3Mbps 的 版 本 ; 使 用 3G 智能 手机 观看 视频 的 用 户 可 以 选择 
300kbps 的 版 本 类似 地 ， 在 视频 会 议 应 用 中 的 视频 能 被 “动态 ” (on-the-fly) 地 压缩 ， 
以 在 会 话 用 户 之 间 给 定 的 可 用 端 到 端 带 宽 上 提供 最 好 的 视频 质量 . 


7. 1.2 音频 的 性 质 


数字 音频 (包括 数字 化 语音 和 音乐 ) 的 审 宽 需求 比 视频 低 得 多 。 然 而 ， 数 字音 频 具 有 
目 己 独特 的 性 质 ， 当 设计 多 媒体 应 用 时 必须 考虑 这 些 性 质 。 为 了 理解 这 些 性 质 ， 我 们 首先 


表 7-1 三 种 因特网 应 用 的 比特 率 需 求 的 比较 
比特 率 67 分 钟 传输 的 字 节 











考虑 模拟 音频 (HARRA E) 是 如 何 转 换 为 数字 信和 号 的 
© 模拟 音频 信和 号 首先 以 某 种 国定 速率 采样 ， 例 如 每 秒 8000 REA. OR PEELE — 
个 任意 的 实数 。 


e 然后 每 个 采样 值 被 “ 四舍五入 ”为 有 限 个 数值 中 的 一 个 。 这 种 操作 被 称 为 量化 
(quantization ) 。 这 些 有 限 个 数值 ( 称 为 量化 值 ) 通常 是 2 AE. 例如 256 个 量化 但 。 
e 每 个 量化 值 由 周 定 数量 的 比特 表示 例如， 如果 有 256 个 量化 值 ， 那 么 每 个 值 
(因此 每 个 音频 采样 ) 用 一 个 字 节 来 表示 。 所 有 样本 的 比特 表示 级 联 在 一 起 就 形成 
了 该 信号 的 数字 表示 。 举 例 来 说 ， 如 果 一 个 模拟 信号 以 每 秒 8000 个 样 值 采 样 ， 而 
日 每 个 样本 被 量化 并 用 8 比特 表示 ， 则 得 到 的 数字 信号 的 速率 就 为 每 秒 64 000 H 
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Fro il a, Ra Ss WUE EARE (也 就 是 解码 ) ， 形 成 一 
anes 然而， 解码 后 的 模拟 信号 仅 是 初始 信号 的 近似 ， 并 且 声 音质 量 也 许 
有 了 明显 的 下 降 (例如 ， 高 频 的 声音 可 能 在 解 但 信号 中 丢失 了 ) 。 通 过 增加 采样 速率 
和 量化 值 的 数量 ， 解 码 信 号 能 够 更 好 地 接近 初始 的 模拟 信和 号。 因此 (与 视频 一 
样 ) ， 在 解码 信号 的 质量 和 比特 率 与 数字 信和 上 ;存储 空间 之 间 存在 一 种 折 中 
我 们 刚才 摘 述 的 基本 编 但 技术 称 为 脉冲 编码 调制 ( Pulse Code Modulation, PCM) if 
音 编码 通 笛 采用 PCM, 采样 速率 为 每 秒 8000 个 样本 ， 每 个 样本 用 8 比特 表 rii 得 到 
64kbps 的 速率 音频 光盘 (CD) 也 使 用 PCM, 采样 速率 为 每 秒 44 100 个 样本 ， 每 个 样本 
用 16 比特 表示 ; 这 样 使 得 单 声 道 速率 为 705. 6kbps， 立 体 声速 率 为 1. 411Mbps. 
然而 ，PCM 编码 的 语音 和 音乐 很 少 在 因特网 中 使 用 ,与 视频 一 样 ， 取而代之 的 是 使 用 压 
缩 技术 来 减 小 流 的 比特 速率 。 人 类 语音 能 被 压缩 到 小 于 10kbps ee 一 种 接近 CD 质 


量 立 体 声 音乐 的 访 行 压缩 技术 是 MPEG 1 第 3 层 ， a 单 的 叫 法 是 ，MP3 编码 融通 篆 能 够 
压缩 为 许多 不 同 的 速率 ; 128kbps tira EH it acai 小 的 声音 失真 。 一 


种 相关 的 标准 是 高 级 音频 编码 (Advanced Audio oy AAC), Abe ZB EAR ZS Hl TAT 
起 来 。 与 视频 一 样 ， 能 够 以 不 同 的 比特 率 生 成 多 重 版 本 的 预先 录制 的 音频 流 。 

音频 比特 率 通常 比 视频 的 比特 率 小 得 多 ， 但 几 户 通常 对 音频 的 小 失误 比 视频 的 小 
失误 更 为 敏感 。 例 如 ， 考虑 在 因特网 上 举行 的 视频 会 以 。 如 果 视 频 信 号 时 不 时 地 丢失 几 
秒 ， 该 视频 会 议 很 可 能 继续 进行 而 没有 太 多 的 用 户 抱 优 。 然 而 ， 如 果 音 频 信 号 经 第 天 失 ， 
用 户 就 可 能 不 得 不 中 止 该 会 话 。 


7. 1.3 多 媒体 网 络 应 用 的 类 型 


因特网 能 BSCE eT a AD AR AS 性 的 多 媒体 应 用 .在 本 小 节 中 ， 我 们 将 多 媒体 应 
用 分 为 三 个 大 类 : 山 流 式 存 储 音频 /视频 ; Desk IP 语音 /视频 ;引流 式 实况 音频 /视频 ， 
Eee 看 te 这 些 应 用 类 型 中 的 每 种 部 有 自己 的 服务 需求 和 设计 问题 的 集合 

. 流 式 存储 音频 和 视频 

为 使 讨论 有 具体 化 ， 我 们 这 里 聚集 流 式 存储 视频 ， 它 通常 结合 了 视频 和 音频 组 件 ， 流 式 
存储 音频 (例如 流 式 音 乐 ) 非常 类 似 于 流 式 存储 视频 ， 尺 管 它 的 比特 率 通 常 要 低 得 多 ， 

在 这 类 应 用 中 ， 依 整 的 媒体 是 预先 录制 的 视频 (如 电影 、 电 视 凶 目 ) 预先 录制 的 体育 完 
事 或 预先 录制 的 用 户 生 成 的 视频 (如常 在 YouTube 上 看 到 的 那些 )。 这 些 预先 录制 的 视频 放 
置 在 服务 天 上 ， 用 户 回 服务 需 发 送 请 求 按 需 观看 视频 。 许多 因特网 公司 今天 提供 流 式 视频 ， 
包括 YouTube (谷歌 ) Netflix 和 Hulu。 据 估计 ， 在 今天 的 因特网 接 人 网 中 流 式 存储 视频 构 
成 了 超过 50% 的 下 载 流量 [Cisco 2011 ] 。 流 式 存储 视频 具有 三 个 关键 的 不 同 特色 ， 

© 流 。 在 流 式 存储 视频 应 用 中 ， 客 户 开始 从 服务 器 接收 文件 几 秒 之 后 ， 通 常 就 开始 

播放 视频 。 这 意味 着 当 客户 正在 从 视频 的 一 个 位 置 开 始 播放 时 ， 与 此 同时 正在 从 
服务 闫 接收 该 视频 的 后 续 部 分 。 这 种 技术 被 称 为 流 ( ad 它 避 免 了 在 开始 
播放 之 前 必须 下 载 整个 视频 (并且 引 起 一 个 潜在 的 长 时 延 

e 相互 作用 。 因 为 媒体 是 预先 录制 的 ， A ANEA, 重新 配置 

前 进 、 重 新 配置 倒退 、 快 进 等 操作 。 从 一 个 客户 提出 这 种 请 求 到 该 动作 在 客户 端 
表现 出 来 ， 可 接受 的 啊 应 时 间 应 该 小 于 几 秒 ， 
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e 连续 播放 ,一 旦 视频 开始 播放 ， 它 应 该 根据 初始 记录 的 时 厅 进 行 。 因 此 ， 为 了 在 
客户 端 播 放 ， 必 须 从 服务 器 中 及 时 接收 数据 ; 和 否则， 用 户 经 历 视频 帧 停滞 (这 时 
Se SEP EUS AM) 或 帆 跳 过 ok AE Ae Dig Ft SE SY MOT) 。 

到 目前 为 止 ， 对 流 式 视频 最 重要 的 性 能 测量 是 平均 在 吐 量 。 为 了 提供 连续 的 播放 ， 网 
络 为 流 式 应 用 提供 的 平均 在 吐 量 必须 至 少 与 该 流 视频 本 身 的 比特 率 一 样 大 。 如 我 们 将 在 
7.2 节 所 见 ， 通 过 使 用 缓存 和 预 取 ， 即 使 在 吞吐 量 波动 的 时 候 ， 提 供 连 续 播 放 也 是 可 能 
的 ， 只 要 平均 行 吐 量 (在 5~10 秒 区 间 平 均 ) 保持 在 视频 速率 之 上 [| Wang 2008 | 。 

对 于 许多 流 式 视频 应 有 用， 预先 录制 的 视频 被 存储 起 来 ， 并 且 从 CDN 而 非 从 单一 的 数 
据 中 心 流 式 播 放 。 也 有 许多 P2P 视频 流 式 应 用 ， 其 中 视频 被 存储 在 用 户主 机 (对 等 方 ) 
上 ， 不 同 视 频 块 从 可 能 分 布 在 全 球 的 不 同 对 等 方 到 达 。 在 得 知 了 因特网 流 式 视频 的 性 能 
后 ， 我 们 将 在 7. 2 节 更 加 深入 地 研究 流 式 视 频 ， 特 别 关注 客户 缓存 、 预 取 、 对 可 用 市 宽 的 
适应 性 质量 和 CDN 分 发 。 

2. 会 话 式 IP 语音 和 视频 

在 因特网 上 的 实时 会 话 式 语音 通常 称 为 因特网 电话 (Internet telephony), PIA MH A 
的 角度 看 ， 它 类 似 于 传统 的 电路 交换 电话 服务 。 它 也 党 被 称 为 IP 语音 (Voice- over- IP, 
VoIP) 。 会 话 式 视频 与 之 类 似 ， 除 了 它 包 括 参 与 者 的 语音 以 及 视频 外 。 今 天 的 大 多 数 语 音 和 
视频 会 话 式 系统 允许 用 户 生 成 具有 三 个 或 更 多 个 参与 者 的 会 议 。 会 话 式 霹 音 和 视频 广泛 地 应 
用 于 今天 的 因特网 中 ， 因 特 网 公司 Skype, QQ 和 Google Talk 目 称 每 天 都 有 数 亿 用 户 

在 第 2 章 有 关 应 用 服务 需求 的 讨论 中 (图 2-4)， 我 们 确定 了 一 些 轴 ， 服 务 需 求 可 以 根 
据 它们 分 类 。 其 中 的 两 个 轴 〈 即 定时 考虑 和 数据 丢失 容忍 度 ) 对 会 话 式 声音 和 视频 应 用 尤其 
重要 。 定 时 考虑 是 很 重要 的 ， 因 为 音频 和 视频 会 话 式 应 用 是 高 度 时 延 敏 感 〈delay- sensitive ) 
的 。 对 于 具有 两 个 或 更 多 个 交互 讲话 者 的 会 话 来 说 ， 从 用 户 讲 话 或 移动 开始 到 该 动作 显现 
在 其 他 只 的 时 延 应 当 小 于 几 百 毫秒 。 对 于 语音 ， 小 于 150ms 的 时 延 不 会 被 人 类 听 者 觉察 
到 ，150 ~400ms 的 时 延 能 够 被 接受 ， 当 时 延 超过 400ms 时 ， 即 使 不 会 使 对 话 变 得 完全 无 
法 理解 ， 也 会 使 语音 会 话 变 得 令 人 诅 丧 。 

万 一 个 方面 ， 会 话 式 多 媒体 应 用 容忍 委 包 (loss-tolerant) ， 即 偶尔 的 丢失 只 会 在 音频 / 
视频 回放 时 偶尔 出 现 干 扰 信 号 ， 而 且 这 些 丢 失 经 常 可 以 部 分 或 者 全 部 地 隐藏 。 这 些 时 延 敏 
感 但 容忍 丢 包 的 特性 明显 不 同 于 那些 弹性 数据 应 用 (如 Web 浏览、 电子 邮件 、 社 交 网 络 
和 远程 注册 等 ) 的 特性 。 对 于 这 些 弹 性 应 用 ， 长 时 延 令 人 恼火 ， 但 并 不 是 特别 有 害 ， 然 而 传 
输 数 据 的 完全 和 完整 性 是 首要 的 。 我 们 将 在 7. 3 节 中 更 加 深入 地 探讨 会 话 式 语音 和 视频 ， 特 
别 关 注 适 应 性 播放 、 前 癌 纠 错 和 差错 掩盖 是 如 何 减 缓 网 络 引 和 人 的 分 组 丢失 和 时 延 的 。 

3. 流 式 实况 音频 和 视频 

这 种 第 三 类 应 用 类 似 于 传统 的 电台 广播 和 电视 ， 只 是 它 通 过 因特网 来 传输 而 已 。 这些 
应 用 允许 用 户 接 收 从 世界 上 任何 角落 发 出 的 实况 无 线 电 广 播 和 电视 传输 。 今天 有 数 以 干 
计 、 遍 及 全 球 的 无 线 电 台 和 电视 台 正 在 因特网 上 广播 内 容 。 

实况 是 类 似 于 广播 的 应 用 ， 它 们 经 党 有 很 多 接收 相同 音频 /视频 万 目的 客户 。 尽 管 通 
过 使 用 4.7 节 中 描述 的 PP 多 播 技术 ， 能 够 有 效 地 完成 回 多 个 接收 方 分 必 实 况 音 频 / 佐 频 ， 
但 是 多 播 分 发 今天 更 多 的 是 通过 应 用 层 多 播 (使 用 P2P 网 络 或 CDN) 或 通过 多 个 独立 的 
单 播 流 来 实现 。 由 于 使 用 流 式 存储 多 媒体 ， 网 络 必须 为 每 个 实况 多 媒体 流 提 供 大 于 该 视频 
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时 延 也 可 能 成 为 问题 ， 从 用 户 选择 观看 一 个 实况 传输 到 播 履 开始， 能 够 容忍 的 时 延 最 多 为 
LO 秒 。 我 们 在 本 书 中 将 不 涉及 流 式 实况 媒体 ， 因 为 用 于 流 式 实况 媒体 的 许多 技术 (如初 
始 缓 存 时 延 、 适 应 性 市 宽 使 用 和 CDN 分 发 ) 都 类 似 于 流 式 存储 媒体 所 使 用 的 技术 。 


7.2 流 式 存 储 视 频 


对 于 流 陈 视频 应 用 ， 预 先 录 和 制 的 视频 放置 在 服务 闫 上 上， 用 户 加 这些 服 务 天 发送 请 求 按 
而 观看 这 些 视频 ， 用户 可 能 从 开始 到 结束 都 在 观看 视频 而 没有 中 断 它 ， 也 可 能 在 视频 结束 
六 停止 观看 它 ， 或 者 通过 暂停、 重新 定位 到 后 面 或 前 面 钳 头 来 与 视频 交互 。 流 式 视 频 系 统 
可 分 为 三 种 类 型 : UDP 流 (UDP streaming), HTTP i (HTTP streaming) 和 适应 性 HTTP 
流 (adaptive HTTP streaming) ， 尽 管 在 实践 中 所 有 这 三 种 系统 孝 在 使 用 ， 但 绝 大 多 数 今 天 
的 系统 应 用 了 HTTP 流 和 适应 性 HTTP fii- 
所 有 这 三 种 形式 的 视频 流 的 共同 特点 是 广 沁 使 用 了 客户 端 应 用 缓存 ， 以 此 来 缓解 变化 
的 闹 到 羡 时 延 和 变化 的 服务 间 和 客户 之 间 可 用 市 宛 量 的 影 啊 。 对 于 流 式 视 频 (存储 的 和 实 
况 的 )， 用 户 通 常 能 够 容 儿 在 客户 请 求 菜 视频 与 该 流 视频 在 客户 端 播放 之 间 有 几 秒 钟 的 初 
始 小 时 延 。 所 以 ， 当 视频 开始 到 达 客 户 时 ， 客 户 不 必 立 即 开 始 播放 ， 反 而 能 够 在 应 用 程序 
绥 存 中 建立 该 视频 的 储备 。 一 旦 该 客户 建立 起 几 秒 钟 的 “已 缓存 但 尚未 播放 ”的 视频 储 
备 ， 客 户 就 可 以 开始 视频 播放 S o APERA (client buffering) 具有 两 种 重要 的 优点 。 
第 一 ， 客 户 端 缓 存 能 够 吸收 服务 带 到 客户 时 延 中 的 波动 。 如 果 某 特殊 部 分 的 视频 数据 延迟 
请 ， 只 要 它 在 “接收 到 但 尚未 播放 ”的 视频 耗 尽 之 前 到 达 ， 这 个 长 时 延 将 不 会 被 注意 到 ， 
第 二 ， 如 末 服 务 站 到 和 客户 市 并 掉 时 低 于 视频 消耗 速率 ， 用 户 能 够 继续 盏 受 连续 的 播放 ， 只 
要 客户 应 用 绥 存 仍 没 有 完全 排 尽 。 
图 7-1 显示 了 客户 疹 的 缓存 。 在 这 个 例子 中 ， 假 定 视频 以 固定 的 比特 率 编码 ， 因 此 每 
个 视频 块 包含 了 能 在 相同 固定 时 间 量 A 区 加 播放 的 视频 帧 。 服 务 器 在 to 传输 第 一 个 视频 
Se, F to +A 传输 第 二 个 视频 块 ， 在 mm +2 传输 第 三 个 视频 块 等 等 。 一 旦 客户 开始 播放 ， 
为 了 重新 产生 初始 录制 视频 的 定时 ， 每 个 块 应 当 在 前 一 个 块 之 后 播放 A 时 间 单 元 。 第 一 个 
视频 块 于 4 时 刻 到 达 ， 第 二 个 视频 块 于 1, 时 刻 到 达 。 第 i 块 的 网 络 时 延 是 服务 此 传 输 该 块 


















pe 服务 器 客户 

。 以 固定 比特 率 一 一 收 到 
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立 7-1 视频 流 中 的 客户 播放 时 延 
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的 时 间 与 客户 收 到 该 块 的 时 间 之 间 的 水 平 距离 ; 注意 到 网 络 时 延 随 视频 块 不 同 而 变化 .在 
此 例子 中 ， 如 果 客 户 准 备 当 第 一 块 在 4 时 刻 一 到 达 就 开始 播放 ， 那 么 第 二 块 将 不 能 在 1, +A 
时 刻 及 时 到 达 进 行 播放 。 在 这 种 情况 下 ， 视 频 播放 或 将 停止 运行 ( 等待 第 二 块 的 到 达 ) 或 
可 能 汤 掉 第 二 块 ， 即 这 两 种 情况 都 将 导致 不 希望 的 播放 损伤 。 相 反 ， 如 果 客 户 将 播放 延迟 
到 总 时刻 开 始 ， 这 时 第 一 块 到 第 六 块 都 已 经 到 达 ， 所 有 已 经 收 到 的 块 在 它们 的 播放 时 间 前 
都 能 够 进行 周期 性 的 播放 


7.2.1 UDP iff 


FR GX A fay Bee UDP ii, FEIE SVEN Te) iE EO TR AH IP x E RCT Jn baia Y 
协议 。 使 用 UDP fit, IRI Amii UDP 以 一 种 稳定 的 速率 记录 下 视频 块 ， 用 与 客户 的 视频 
消耗 速率 相 匹 配 的 速率 传输 视频 。 例 如 ， 如 果 视 频 消耗 率 是 2Mbps， 每 个 UDP 分 组 承载 
8000 比特 视频 ， 则 服务 天 将 每 隔 〈8000 比特 ) 7 (2Mbps) =4ms 问 其 三 接 字 发 这 一 个 
UDP 分 组 。 如 我 们 在 第 3 BEATA, BI UDP 未 采用 茶 种 拥塞 控制 机 制 ， 所 以 服务 袁 能 够 
以 视频 的 消耗 速率 将 分 组 推进 网 络 中 ， 而 无 TCP 的 速率 控制 的 限制 ，UDP 流通 和 常 使 用 很 
小 的 客户 站 缓存， 空间 维持 小 于 1 秒 视 频 就 足够 了 . 

在 将 视频 块 传递 给 UDP 之 前 ， 服 务 器 将 视频 块 封装 在 运输 分 组 中 ， 该 运输 分 组 是 专 
门 为 传输 音频 和 视频 而 设计 的 ， 使 用 了 实时 传输 协议 (Real-Time cele Tatal. RIP) 
| RFC 3550] KER (IEE) 的 方案 。 我 们 将 在 7.3 WNE RTP, IKER I] 
将 在 会 话 式 语音 和 视频 系统 环境 中 讨论 RTP. 

UDP 流 的 另 一 种 不 同 的 性 质 是 ， 除 了 服务 器 到 客户 的 视频 流 外 ， 两 者 间 还 并 行 地 维护 
一 个 单独 的 控制 连接 ， 通 过 该 连接 ， 客 户 可 发 送 有 天 会 话 状 态 变 化 的 命令 (如 和 暂停、 重新 
开始 、 重 定位 等 ) ， 这 种 控制 连接 在 许多 方面 类 似 于 我 们 在 第 2 章 中 学 习 的 FTP 控制 连接 
在 本 书 配 套 Web 网 站 上 更 为 详细 地 解释 了 实时 流 协 议 (Real-Time Streaming Protocol, 
RTSP) | RFC 2326 | ， 它 是 一 种 用 于 这 样 的 控制 连接 的 流行 开放 协议 

尽管 UDP 流 已 经 在 多 个 开源 系统 和 专用 产品 中 得 到 应 用 ， 但 它 有 三 个 重大 不 足 . 首 
先 ， 由 于 服务 带 和 控制 之 间 的 可 用 市 宽 无 法 预测 并 且 是 变化 的 , 恒定 速率 UDP 流 不 能 够 
提供 连续 的 播放 。 例 如 考虑 以 下 场景 : WARRE RA 1Mbps, IRI AiE n H r de 
AE 1Mbps， 但 每 过 几 分 钟 就 有 几 秒 钟 时 间 其 可 用 市 宽 低 于 1Mbps。 在 这 种 场景 下 ， 以 
1 Mbps 恒定 速率 经 RTP/UDP 传输 视频 的 UDP 流 系统 很 可 能 将 提供 不 好 的 用 户 体验 ， 在 可 
用 市 宽 低 于 1Mbps Ziar Æ fri aids tot, UDP 流 的 第 二 个 缺点 是 它 要 求 如 RTSP 服务 大 这 
样 的 媒体 控制 服务 右 ， 以 对 每 个 进行 中 的 客户 会 话 处 理 客 户 到 服务 带 的 交互 请 a 
户 状态 (例如 在 视频 中 的 客户 播放 点 ， 视 频 是 否 被 暂停 或 播放 等 )。 这 增加 了 部 营 大 规模 
的 按 需 视频 系统 的 总 体 成 本 和 复杂 性 。 第 三 个 缺点 是 许多 防火 墙 配 园 为 阻 寨 UDP 流量， 
防止 这 些 防 火 墙 后 面 的 用 户 接 收 UDP 视频 。 


Teg FIP 流 


在 HTTP 流 中 ， 视 频 直接 作为 具有 一 个 特定 URL 的 普通 文件 存储 在 HTTP 服务 此 上 
当 用 户 要 看 视频 时 ， 客 户 和 服务 器 之 间 建 立 一 个 TCP 连接 ， 并 且 发 送 一 个 对 该 URL 的 
HTTP GET 请 求 。 服 务 器 则 尽 可 能 快 地 在 HTTP 响应 报 文中 发 送 该 视频 文件 ， 这 就 是 说 
LA TCP 拥塞 控制 和 流 控制 允许 的 鲜 可 能 快 的 速率 进行 处 理 . 在 客户 疹 上， 字 节 收集 在 一 个 
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客户 应 用 缓存 中 。 一 且 在 缓存 中 字 节 数量 超过 了 预先 设 定 的 国 什 ， 该 客户 应 用 程序 开始 播 
放 ， 有 具体 而 言 ， 它 周期 性 地 从 客户 应 用 缓存 中 抓 取 视频 帧 ， 对 帧 解压 缩 并 在 用 户 弃 幕 上 显 
NE. 

我 们 在 第 3 章 学 习 过 ， 当 通过 TCP 传输 一 个 文件 时 ， 由 寺 TCP ayaa se Pe dl Ll, Hk 
务 需 到 客户 的 传输 速率 可 能 变化 很 大 。 特别 是 ， 传 输 速 率 以 与 TCP 拥 索 控制 相关 联 的 
“锯齿” 形 (例如 ， 图 3-53) 变化 并 非 罕见 ,此 外 ,分 组 也 能 由 于 重 传 机 制 而 被 大 大 延 
WS. 因为 TCP 的 这 些 特 点 ， 在 20 世纪 90 年 代 大 多 数 人 关于 会 话 式 的 看 法 是 流 式 视频 将 不 


了 客户 缓存 和 预 取 (在 下 面 讨论 ) 技术 时 ，TCP 的 拥塞 控制 和 可 靠 数 据 传输 机 制 并 不 一 定 
会 妨 但 连续 播放 

{E TCP 上 使 用 HTTP 也 使 得 视频 穿越 防火 墙 和 NAT (ET Fe ae BAC A A BAS UDP 流 
量 但 允许 大 部 分 HTTP 流量 通过 ) 更 为 容易 。HTTP 流 消 际 了 因 帘 要 媒体 控制 服务 融 (如 
RTSP 服务 器 ) TAY AN, 减少 了 在 因特网 上 大 规模 部 敬 的 成 本 ,由 于 所 有 这 些 优 点 ， 
今天 的 大 多 数 流 式 视频 应 用 (包括 YouTube 和 Netflix) 都 使 用 HTTP 流 (在 TCP L) 作为 
它 的 底层 流 式 协议 - 

1.， 预 取 视 频 

我 们 刚才 学 习 了 客户 端 缓 存 可 用 于 缓解 变化 的 端 到 端 时 延 和 变化 的 可 用 带宽 的 影响 
在 前 面 图 7-1 的 例子 中 ， 服 务 占 以 视频 播放 的 速率 传输 。 然 而 ， 对 于 流 式 存储 视频 ， 客 户 
能 够 尝试 以 高 于 消耗 速率 的 速率 下 载 视频 ， 因 此 预 取 (prefetching) 将 来 会 被 消耗 的 视频 
帧 。 该 预 取 的 视频 当然 存储 在 客户 应 用 缓存 中 。 这 样 的 预 取 日 然 伴 随 TCP 流出 现 ， 因 为 
TCP 拥塞 避免 机 制 将 试图 使 用 服务 大 和 客户 之 间 的 所 有 可 用 审 宽 。 

为 了 深入 洞察 预 取 技 术 ， 我们 来 举 个 简单 的 例子 .假设 视频 消耗 速率 是 1Mbps， 而 网 
络 从 服务 器 到 客户 能 够 以 恒定 的 1. 5Mbps 速率 交付 视频 客户 则 不 仅 能 够 以 非常 小 的 播放 
时 延 播 放 该 视频 ， 而 且 还 能 够 以 每 秒 500Kb 的 量 增 加 缓存 的 视频 数据 以 这 种 方式 ， 如 果 
后 来 该 客户 在 一 段 短暂 时 间 内 以 小 于 1Mbps 的 速率 接收 数据 ， 该 客户 由 于 在 其 缓存 中 的 储 
备 将 能 够 继续 提供 连续 的 播放 。 [ Wang 2008] 显示 了 了 当 平 均 TCP 乔 叶 量 大 致 为 媒体 比特 
率 的 两 倍 时 ，TCP 流 导 臻 最 小 的 饥饿 和 低 缓存 时 延 ， 

2. 客户 应 用 缓存 和 TCP 缓存 

图 7-2 说 明了 客户 和 服务 需 之 间 HTTP 流 的 交互 。 在 服务 带 侧 ， 视 频 文件 中 的 白色 部 
分 已 经 通过 服务 带 的 套 接 字 进行 发 送 ， 而 黑色 部 分 是 留 下 待 发 送 的 部 分 。 在 “通过 套 接 学 
的 门 传送 ”之 后 ， 放 置 在 TCP 发 送 缓存 中 的 字 节 在 被 传输 进 因 特 网 之 前 如 第 3 TF - 
在 图 7-2 P, AA TCP 发 送 缓存 显 示 为 满 ， 服 务 需 瞬间 防止 从 视频 文件 发 送 更 多 的 字 节 到 
套 接 字 。 在 客户 侧 ， 客 户 应 用 程序 (媒体 播放 融 ) 从 TCP 接收 缓存 (通过 其 客户 套 接 字 ) 
污 出 字 节 并 将 字 节 放 人 客户 应 用 缓存 中 。 与 此 同时 ， 客 户 应 用 程序 周期 性 地 从 客户 应 用 组 
存 中 抓 取 视 频 帧 ， 解 压缩 并 显示 在 用 户 屏 幕 上 ,注意 到 如 果 客 户 应 用 缓存 大 于 该 视频 文 
件 ， 则 从 服务 器 存储 器 到 客户 应 用 缓存 移动 字 节 的 整个 过 程 等 价 于 普通 文件 经 HTTP 的 下 
载 过 程 ， 即 客户 直接 将 视频 用 TCP 允许 的 尽 可 能 快 的 速率 从 服务 带 中 拉 出 来 。 

现在 考虑 在 流 播放 期 间 当 用 户 暂 停 视 频 时 将 发 生 的 现象 。 在 暂停 期 间 ， 比 特 示 从 客户 
应 用 缓存 中 删除 ， 甚 至 比特 继续 从 服务 器 进入 缓存 。 如果 客户 应 用 缓存 是 有 限 的 ， 它 可 能 








区 
满 ， 字 节 不 再 从 客户 TCP 接收 缓存 中 删除 ， 因 此 它 也 会 变 满 。 一 旦 客户 TCP 接收 缓存 变 
满 ， 字 节 不 再 从 服务 器 TCP 发 送 缓存 删除 ， 因 此 它 也 变 满 。 一旦 客户 TCP 发 送 缓存 变 满 ， 
服务 器 不 能 回 套 接 字 中 发 送 任何 更 多 的 字 节 。 因 此 ， 如 果 用 户 和 暂停 和 视频， 服务 厢 可 能 被 迫 
停止 传输 ， 在 这 种 情况 下 服务 带 被 阻塞 ， 下 到 用 户 恢 复 该 视频 。 


最 终 会 变 满 ， 这 将 反 过 来 引起 对 服务 器 的 “ 反 向 压力 ”， 具 体 而 言 ， 一 旦 客户 应 用 缓存 变 
F 
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| 周期 性 地 读 出 

em Wi, AER 
接收 缓存 TCP | 显示 在 屏幕 上 


视频 文件 SSA 应 用 缓存 





图 7-2 经 HTTPZTCP 的 流 式 存储 视频 


事实 上 ， 甚 至 在 常规 的 播放 过 程 中 ( 即 没有 暂停 ) ， 如 果 客 户 应 用 缓存 变 满 ， 反 回 压 
力 将 引起 TCP 缓存 变 满 ， Sii iH (EARS l HA FR 为 ) 决定 其 产生 的 速率 ， 注意 到 当 
客户 缓存 删除 f 比特 ， 它 在 客户 应 用 缓存 中 产生 了 /比特 的 空间 ， 这 依次 允许 服务 从 发 送 突 
外 的 f 比特。 因此 ， 服 务 胡 发送 速率 不 能 比 客 aie 更 高 。 因 此 ， 当 使 用 HTTP 
流 时 ， 一 个 满 的 客户 应 用 缓存 间接 地 对 服务 器 到 客户 能 够 发 送 的 视频 速率 施加 了 限制 ， 

3， 流 式 视 频 的 分 析 


某 些 简 单 的 建 模 将 有 助 于 洞察 由 于 应 用 缓存 消耗 所 产生 的 初始 播放 时 延 和 停 浪 。 如 
图 7-3 所 示 ，B 表示 客户 应 用 缓存 的 长 度 (以 比特 计 )，0Q 表示 在 客户 应 用 缓存 开始 播放 之 
前 必须 被 缓存 的 比特 数量 。( 当然 ，Q < B.) , 表示 视频 消耗 速率 ， 即 客户 在 播放 期 间 从 客 
户 应 用 缓存 提取 比特 的 速率 .在 此 情况 下 ， 举 例 来 说 ， 如 果 视 频 的 帧 速率 是 30 帧 / 秒 ， 每 
(压缩 ) 帧 是 100 000 比特 ， 则 r=3Mbps。 为 了 从 细节 看 整体 ， 我 们 将 忽略 TCP 的 发 送 和 
接收 缓存 


填充 速率 =x | 消耗 速率 =/ 
_ IE EN | 
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”客户 应 用 缓存 


图 7-3 用 户 流 式 视 频 的 客户 并 缓存 的 分 析 
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我 们 假设 无 论 何 时 客户 缓存 为 非 空 时 ， 服 务 硕 以 一 种 恒定 速率 x 发 送 比 特 。( 这 是 一 
种 显而易见 的 简化 ， 因 为 TCP 的 发 送 速 率 由 于 拥塞 控 制 而 变化 ; 在 本 章 后 面 的 习题 中 我 们 
将 考察 更 为 真实 的 与 时 间 相 关 的 速率 x(1) ,) 假设 在 时 刻 1=0， 应 用 缓存 为 空 ， 视 频 开 始 
到 达 客 户 应 用 缓存 ,我 们 现在 问 ， 在 什么 时 刻 1=1, 开始 播放 呢 ? 并 且 在 播放 过 程 中 ， 什 
ZY Al t=, 客户 应 用 缓存 变 满 呢 ? 

首先 ， 我 们 来 确定 t,， 此 时 O 比特 已 经 进入 应 用 缓存 并 且 开 始 播放 ， 前 面 讲 过 比特 以 
速率 x 到 达 客 户 应 用 缓存 ， 并 且 在 开始 播放 之 前 没有 比特 从 其 缓存 中 删除 所以， 建立 Q 
比特 所 震 的 时 间 (初始 缓存 时 延 ) jE t, = Q/x. 

我 们 现在 来 决定 L, 这 是 客户 应 用 缓存 变 满 的 时 刻 。 我 们 先 观 察 ， 如 果 x <r (EIR 
服务 咒 发 送 速率 小 于 视频 消耗 速率 ) ， 则 客户 缓存 将 决 不 会 满 ! | 时 刻 1, 开始 ， 绥 存 
将 以 速率 上 排 空 并 且 仅 以 速率 x<r 填 充 ， 最终 客 户 缓存 将 完全 排 空 ， 此 时 当 客 户 缓存 等 待 
人 视频 将 在 屏幕 上 停 注 . 所 以 ， Se td 
于 视频 wk 播放 将 在 连续 播放 期 和 停滞 播放 期 之 间 进 行 变动 ”在 课 后 习题 中 ， 将 请 你 
决定 每 个 连 ee 
Ny 在 这 种 情况 下 ， 在 时 刻 4, 开始 ， 缓 存 以 x -r 的 速率 从 0Q 增加 到 8， 因 为 比特 

速率 r TA RE(A ER x 到 达 ， 如 图 7-3 所 示 。 有 了 这 些 提示 ， 在 课 后 习题 中 将 请 你 决定 

即 客 户 缓存 变 满 的 时 刻 ， 注意 到 当 网 络 中 的 可 用 速率 大 于 视频 速率 时 ， 在 初始 缓存 时 
EE. A PAS Fiz ih AS ALIAS k 

4. 视频 的 早期 中 止 和 重 定位 

HTTP 流 系统 经 党 利用 HTTP GET 请 求 报 文中 的 HTTP 字 节 范围 首部 (HTTP byte- 
range header) ， 该 首部 指示 了 客户 当前 要 从 所 希望 的 视频 ü RRE te Al. H RE 
视频 中 及 时 重 定 位 (BIBER) 到 末 来 点 时 ， 这 特别 有 用 。 当 用 户 重 定位 到 一 个 新 位 置 AHT, 
客户 发 送 一 个 新 HTTP iik, ASE ye E a aB E R Ar 当 从 文件 的 哪个 字 节 起 发 送 数 
Hi. “SARS APNEA BAY HTTP 请 求 时 ， 它 能 够 忘记 任何 较 早 的 请 求 ， 而 是 由 他 市 范围 
请 求 中 指示 的 字 节 开始 发 送 

在 我 们 讨论 重 定 位 主题 的 时 候 ， 我 们 简要 地 提 及 当 某 用 户 重 定位 到 视频 中 的 某 个 未 来 
点 或 提前 终止 视频 时 ， 革 些 由 服务 需 发 送 的 已 预 取 但 尚未 观看 的 数据 将 不 会 被 观看 ， 即 导 
致 了 网 络 带宽 和 服务 需 资 源 的 滔 费 。 例如， 假设 在 视频 中 的 某 时 刻 @ 客户 缓存 充满 B 比 
特 ， 在 此 时 用 户 重 定位 到 视频 中 的 某 个 瞬间 >， + B/r, 然后 从 这 点 起 观察 视频 直到 结 - 
在 这 种 情况 下 ， 缓 存 中 的 所 有 B 比特 将 未 被 观看 ， 用 于 传输 这 B 比特 的 审 宽 和 服务 器 资源 
完全 被 浪费 掉 了 。 在 因特网 中 ， 有 大 量 的 带宽 因 提 前 终止 而 浪费 ， 这 些 成 本 可 能 相当 大 ， 
特别 是 对 于 无 线 链 路 [Thm 2011]。 由 于 这 个 原因 ， 许 多 流 系统 仅 使 用 了 长 度 适 当 的 客户 
应 用 缓存 ， 或 者 将 限制 在 HTTP 请 求 中 使 用 字 世 范围 首部 预 取 的 视频 数量 | Rao 2011]; 

重 定 位 和 提前 终止 可 以 与 下 列 做 法 类 比 : 京 调 了 很 多 肉 ， 仅 号 了 一 部 分 ， 并 将 其 他 都 
扔 掉 ， 因 而 浪费 了 食物 。 因 此 ， 下 次 你 因为 没有 吃 完 所 有 晚餐 而 被 父母 批评 浪费 食物 时 ， 
尔 能 够 迅速 反驳 : 当 他 们 在 因特网 上 观看 电影 并 进行 市 宽 壬 定位 时 ， 他 们 浪费 了 市 区 和 服 
Fat Gt UR! 但 是 ， 别 人 错 了 不 等 于 你 对 了 ， 食 物 和 寓 宽 都 不 应 被 浪费 ! 


7.2.3 适应 性 流 和 DASH 


尽管 如 前 一 小 节 所 述 ，HTTP 流 在 实践 中 已 经 得 到 广泛 部 辕 (Aln, YouTube A ASE 
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A a aa), HEERA ee, MA A P se FV) 2g SY a. IS ET AS [i] 
HJJH :或 者 对 于 相同 客户 的 下 而 言 ， 为 客户 可 用 的 融 宽 量 有 很 大 不 同 。 这 导致 了 一 
种 新 型 基于 HTTP 的 流 的 研发， 它 第 第 被 杯 为 经 HTTP 的 动态 适应 性 流 (Dynamic Adaptive 
Streaming over HTTP, DASH). 在 DASH 中 ， 视 频 编 码 为 几 个 不 同 的 版 本 ， 其 中 每 个 版 本 
有 具有 不 同 的 比特 率 ， 对 应 于 不 同 的 质量 水 平 。 客 户 动态 地 请 求 来 日 不 同 版 本 且 长 度 为 几 秒 
钟 的 视频 段 数 据 块 ， 当 可 用 市 宽 量 较 口 时， 客户 目 然 地 选择 来 日 珊 速 率 版 本 的 块 ; 当 可 用 
带宽 量 较 低 时 ， 客 户 自然 地 选择 来 自 低 速率 版 本 的 块 。 客 户 用 HTTP GET 请 求 报 文 一 次 选 
择 一 个 不 同 的 块 | Akhshabi 2011 |。 

一 方面 ，DASH 允许 客户 使 用 不 同 的 以 太 网 接 入 速率 流 式 播放 具有 不 同 编 公 速率 的 视 
频 。 使 用 低速 3G 连接 的 客户 能 够 接收 一 个 低 比特 率 ( 和 低 质 量 ) 的 版 本 ,使 用 光纤 连接 
的 客户 能 够 接收 高 质量 的 版 本 。 在 另 一 方面 ， 如 果 端 到 闪 市 宽 在 会 话 过 程 中 改变 的 话 ， 
DASH 人 允许 客户 适应 可 用 惠 宽 ， 这 种 特色 对 于 移动 用 户 特别 重要 ， 当 移动 用 户 相 对 于 基站 
移动 时 ， 通 党 他们 能 感受 到 其 可 用 币 沉 的 流动。 例如 ，Comcast T tb ee — Pa M PE iit FH 
统 ， 其 中 每 个 视频 源 文件 编码 成 8 ~ 10 种 不 同 的 MPEG-4 格式 ， 通 过 实施 适应 性 来 应 对 变 
化 的 网 络 和 设备 条 件 ， 人 允许 最 高 质量 的 视频 格式 以 流 形 式 发 送 给 客户 ， 

使 用 DASH 后 ， 每 个 视频 版 本 存储 在 HTTP 服务 器 中 ， 每 个 部 有 一 个 不 同 的 URL. 
HTTP 服务 需 也 有 一 个 告示 文件 (manifest file)， 为 每 个 版 本 提供 了 一 个 URL 及 其 比特 率 ， 
客户 首先 请 求 该 告示 文件 并 且 得 知 各 种 各 样 的 版 本 。 然后 客户 通过 在 HTTP GET 请 求 报 文 
中 对 每 块 指 定 一 个 URL 和 一 个 字 节 范围 ， 一 次 选择 一 块 . 在 下 载 块 的 同时 ， 客 户 也 测量 
接收 寓 宽 并 运行 一 个 速率 决定 算法 来 选择 下 次 请 求 的 块 . 和 目 然 地 ， 如 果 客 户 缓存 的 视频 很 
多 ， 并 且 测 量 的 接收 带宽 较 高 ， 它 将 选择 一 个 高 速率 的 版 本 。 同 样 ， 如 采 客 户 缓存 的 视频 
很 少 ， 并 且 测 量 的 接收 带宽 较 低 ， 它 将 选择 一 个 低速 率 的 版 本 。 因此 DASH 允许 客户 日 由 
地 在 不 同 的 质量 等 级 之 间 切 换 ， 因 为 由 改变 版 本 引起 的 比特 率 突然 下 降 可 能 会 导致 可 觉察 
到 的 视觉 质量 下 降 ， 所 以 可 以 使 用 多 个 中 间 版 本 来 减 小 比特 率 ， 从 而 平滑 地 迁移 到 客户 消 
标 速 率 低 于 其 可 用 接收 带宽 之 下 的 某 个 速率 。 当 网 络 条 件 改 善 时 ， 客 户 则 随后 能 够 选择 来 
AEEA LOR AS AYER 

通过 动态 地 监视 可 we 等 级 ， 随 着 版 本 切换 而 调节 传输 速率 ，DASH 经 
党 能够 在 可 能 的 最 好 质量 等 级 下 实现 连续 播放 ， 而 没有 帧 停 浏 或 跳跃 ， 此 外 ， 由 于 客户 

( 而 不 是 服务 融 ) 掌控 相关 信息 es 下 一 次 发 送 哪 个 块 ， 所 以 这 个 方案 也 改善 了 服务 大 
侧 的 扩展 性 ， 该 方法 的 另 一 个 好 处 是 客户 能 够 使 用 HTTP 字 节 范围 请 求 来 精确 地 控制 预 取 
的 视频 量 ， 这 些 视频 将 缓存 在 客户 本 地 . 

在 提 及 许多 实现 后 ， 我 们 对 DASH 的 简要 讨论 进行 总 结 ， 服 务 需 不 仅 存储 视频 的 许多 
版 本 ， 还 单独 存储 了 音频 的 许多 版 本 ， 每 个 音频 版 本 有 上 自己 的 质量 等 级 和 比特 率 以 及 月 己 
的 URL。 在 这 些 实 现 中 ， 客 户 动态 地 选择 视频 和 音频 块 ， 本 地 同步 音频 和 视频 播放 。 


7.2.4 内 容 分 发 网 

今天 ， 许 多 因特网 视频 公司 日 复 一 日 地 向 数 以 百 万 计 的 用 户 按 需 分 发 每 秒 数 兆 比特 的 
i (UN, YouTube KIARA E tee A ILIA 4S, BE KK Ie] 4 tht FEA A Pa ALI Ait: | Ding 
2011 ] ， 向 位 于 全 世界 的 所 有 用 户 流 式 传输 所 有 流量 同时 提供 连续 播放 和 高 交互 性 显然 是 
一 项 有 挑战 性 的 任务 。 
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对 于 一 个 因特网 视频 公司 ， 或 许 提供 流 式 视频 服务 最 为 直接 的 方法 是 建立 单一 的 大 规 
模 数据 中 心 ， 在 数据 中 心中 存储 其 所 有 视频 ， 并 直接 从 该 数据 中 心 回 世界 范围 的 客户 传输 
流 式 视 频 。 但 是 这 种 方法 存在 三 个 问题 。 首 先 ， 如 果 客 户 远 离 数 据 中 心 ， stare 
分 组 将 跨越 许多 链 路 并 很 可 能 通过 许多 ISP， 其 中 某 些 ISP 可 能 位 于 不 同 的 大 济 ， 
果 这 些 链 路 之 一 提供 的 吞吐 量 小 于 视频 消耗 速率 ， litle 
用 户 带 来 恼人 的 停滞 时 延 。( 第 1 RE URE, — 28 A Sing BU Sim Ar E de PR SURE De HY P E at PT 
决定 .) 出 现 这 种 事件 的 可 能 性 随 着 端 到 端 路 径 中 链 路 数量 的 增加 而 增加 。 第 二 个 缺陷 是 
em 的 通信 和 链 路 发 送 许多 次 ， 这 不 仪 浪费 了 网 络 市 这 ， 因 特 网 视频 
\ 司 自己 也 将 为 向 因特网 反复 发 送 相 同 的 字 节 而 癌 其 ISP 运营 商 (连接 到 数据 中 心 ) 支付 
WE 
通 向 因特网 的 链 路 月 沉 ， 它 将 不 能 够 分 发 任何 视频 流 本 
为 了 应 对 向 分 布 于 全 世界 的 用 户 分 发 巨 量 视频 数据 的 挑战 ， 几 乎 所 有 主要 的 视频 流 公 
本 部 利用 内 容 分 发 网 (Content Distribution Network, CDN). CDN 管理 分 布 在 多 个 地 理 位 置 
上 的 服务 器 ， 在 它 的 服务 器 中 存储 视频 (和 其 他 类 型 的 Web 内 容 ， 包 括 文 档 、 图 片 和 音 
WO 的 副本 ， 并 且 所 有 试图 将 每 个 用 户 请 求 定向 到 一 个 将 提供 最 好 的 用 户 体 验 的 CDN 位 
i, CDN 可 以 是 专用 CDN (private CDN)， 即 它 由 内 容 提 供 商 自己 所 拥有 ; 例如 ， 合 歌 的 
CDN 分 发 YouTube 视频 和 其 他 类 型 的 内 容 。 男 一 种 CDN 可 以 是 第 三 方 CDN (third- party 
CDN) ， 它 代表 多 个 内 容 提供 商 分 发 内 容 ; 例如 ，Akamia 的 CDN 是 一 个 第 三 方 CDN,， 在 
其 他 用 户 中 分 发 Netflix Al Hulu, FAR CDN 的 一 个 可 读 性 强 的 展望 见 | Leighton 2009 | 。 





谷歌 的 网 络 基础 设施 


为 了 支持 谷歌 的 巨 量 云 服务 阵列 ， 包 括 搜索 、gmail、 日 程 表 、YouTube 视频 、 地 
图 、 文 档 和 社交 网 络 ， 人 谷歌 已 经 部 署 了 一 个 广泛 的 专用 网 和 CDN 基础 设施 ,谷歌 的 
CDN 基础 设施 具有 三 个 等 级 的 服务 器 集群 : 

e 8 个 “大 型 数据 中 心 ”， 其 中 6 个 位 于 美国 ，2 欧洲 | Google Locations 
2012]， 每 个 数据 中 心 具有 10 万 台 虚 右 的 服务 器 这 些 “ 大 型 数据 中 心 ” 负 责 
服务 于 动态 的 (并 且 经 常 是 个 性 化 的 ) AB, SERRA 直 果 和 gmail 报 文 ， 

e 大 约 30 个 “邀请 做 客 (bring-home) 服务 器 ”集群 (参见 7.2.4 节 )， 其 中 每 
个 集群 大 约 由 100 ~500 台 服 务 器 组 成 [Adhikari 2011a]。 这 些 集 群 位 置 分 布 于 
人 全球， 每 个 位 置 通 常 靠 近 多 个 第 一 层 ISP PoP, 这 些 集群 负责 服务 于 静态 内 容 ， 
包括 YouTube 视频 | Adhikari 2011a |. 

o 数 以 百 计 的 “深入 (enter-deep) 服务 器 ”集群 (参见 7.2.4 节 )， 每 个 集群 位 
于 一 个 接 入 ISP 中 ,这 里 一 个 集群 通常 由 位 于 一 个 机 架 上 的 数 十 台 服 务 器 组 成 ， 
oe bee 执行 TCP HB (参见 3.7 7) 并 服务 于 静态 内 容 [Chen 
2011] ， 包 括 体现 搜索 结果 的 Web 网 页 的 静态 部 分 

所 有 这 些 数 据 中 心 和 集群 位 置 与 谷歌 自己 的 专用 网 连接 在 一 起 ， 作 为 一 个 巨大 的 

AS (AS 15169) 的 一 部 分 。 当 某 用 户 进 行 搜 索 请 求 时 ， 该 请 求 常常 先 经 过 本 地 ISP 发 送 


到 邻近 的 “深入 服务 器 ”缓存 中 ， 从 这 里 检索 静态 内 容 ; 同时 将 该 静态 内 容 提 供给 客 
户 ， 邻 近 的 缓存 也 经 谷歌 的 专用 网 将 请 求 转发 给 “大 型 数据 中 心 ”， sk LHe Pik 
的 搜索 结果 ， 对 于 某 YouTube 视频 ， 该 视频 本 身 可 能 来 自 一 个 “邀请 坐 客服 务 器 ”组 
存 ， 而 围绕 该 视频 的 Web 网 页 部 分 可 能 来 自 邻 近 的 “深入 服务 器 ”缓存 ， 围 绕 该 视频 
的 广告 来 自 数 据 中 心 。 总 的 来 说 ， 除 了 本 地 ISP， 谷 歌 云 服 务 在 很 大 程度 上 是 由 独立 于 
公共 因特网 的 网 络 基础 设施 提供 的 ， 


CDN 通 稍 采用 两 种 不 同 的 服务 斑 安 置 原 则 | Huang 2008) ; 

© 深入 。 第 一 个 原则 由 Akamai 首创 ， 该 Ca (i ili 2 4 PRA TR A ISP 中 部 普 服 
FS tit EAE RRA FI] ISP 的 接 APII (Æ 1.3 WPR FEAR.) Akamai 在 大 约 
1700 MAER HA PPT IK i ROA pe Se et A, a et ok oti HPA 
CDN 集群 之 间 (内 容 从 这 里 收 到 ) 链 路 和 路 由 做 的 数量 ， 从 而 改善 了 了 用户 感 受 的 
时 廷 和 和 厨 叶 量 。 因 为 这 种 高 度 分 布 式 设计 ， 维 护 和 管理 集群 的 任务 成 为 挑战 ， 

。 邀请 做 客 。 第 二 个 设计 原则 由 Limelight We CDN 公司 所 采用 ， 该 原则 是 通 
过 在 少量 〈 例 如 10 个) 关键 位 置 建造 大 集群 并 使 用 NO 
邀请 到 ISP 做客。 不 是 将 KEREI TEIKA Br, xe CDN in Fs AA BE ERE I ELE 
这 样 的 位 置 上 ， 即 同时 靠近 许多 第 一 层 ISP 的 PoP 的 位 置 (参见 1.3 节 )， 例 如 ， 
一 个 大 城市 中 同时 徘 近 AT&T PoP 和 Verizon PoP 的 几 英 里 WALA. RAI 计 原 
则 相 比 ， 邀 请 做 客 设 计 通 稼 产生 较 低 的 维护 和 管理 开销 ， 可 能 以 对 妆 用 户 的 较 高 
时 延 和 较 低 吞吐 量 为 代价 

一 旦 CDN 的 集群 准备 就 绪 ， 它 就 可 以 路 集群 复制 内 容 。 CDN 可 能 不 希望 将 每 个 视频 
的 副本 放置 在 每 个 集群 中 ， A E sre eas T OE Es E 
CDN Ye 44-25 AE AE AY See, tT Fae 18] a ey Pe ES sR EP e — AE TZ 
A Ui AY) Ge ARE Tg ok SE eu, WUE eR a (从 某 中 心 仓 库 或 者 从 另 一 个 集群 ) Sd 
户 流 式 传 输 视 频 时 的 同时 在 本 地 存储 一 个 副本 ， 类 似 于 因特网 缓存 〈 参 见 第 2 a), E 
集群 存储 和合 变 满 时 ， 它 删 际 不 经 党 请 求 的 视频 

1. CDN 操作 

EVIE Ix PPP CDN 的 重要 方法 后 ， 我 们 现在 深入 看 看 CDN 操作 的 细节 。 当 用 
户主 机 中 的 一 个 浏览 器 指令 检索 一 个 特定 的 视频 (由 URL 标识 ) WY, CDN 必须 截获 该 请 
求 ， 以 便 能 够 : 山 确定 此 时 适合 用 于 该 客户 的 CDN 服务 器 集群 ;， 书 将 客户 的 请 求 重 定 问 
到 该 集群 的 某 台 服务 顺 。 我 们 很 快 将 讨论 CDN 是 如 何 能 够 确定 一 个 适 nies 的 。 但 是 
我 们 首先 考察 截获 和 重 定向 请 求 所 依赖 的 机 制 。 

大 多 数 CDN 利用 DNS 来 截获 和 重 定 向 请 求 ; 这 种 使 用 DNS 的 一 个 有 趣 讨 论 见 [ Vixie 
2009 | 。 我 们 考虑 用 一 个 简单 的 例子 来 说 明 通 第 是 怎样 涉及 DNS 的 .假定 一 个 内 容 提供 商 
NetCinema, fe (fl TBI CDN 公司 KingCDN 来 问 其 客户 分 发 视频 。 在 NetCinema 的 Web 
网 页 上 ， 它 的 每 个 视频 都 被 指派 了 一 个 URL， 该 URL 包括 了 字符 串 “video” 以 及 该 视频 
本 和 映 的 独特 标识 符 ; PON, FoR RE 7 可 以 指派 为 http:/video. netcinema. com/6Y7B23V. 4% 
下 来 出 现 如 图 7-4 所 示 的 6 个 步 又: 

1) 用 户 访 问 位 于 NetCinema 的 Web 网 页 
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2) 当 用 户 点 击 链接 http://video. netcinema. com/6Y7B23V 时 ， 该 用 户主 机 发 送 As 
对 于 video. netcinema. com 的 DNS 请 求 

3) 用 户 的 本 地 DNS 服务 器 (LDNS) 中 继 该 DNS 请 求 到 一 台 用 于 NetCinema 的 权威 
DNS 服务 器 ， 该 服务 右 观察 到 主机 名 video. netcinema. com 中 的 字符 串 “video”。 为 了 将 该 
DNS 请 求 移交 给 KingCDN ，NetCinema 权威 DNS 服务 器 并 不 返回 一 个 IP 地 址 ， 而 是 向 
LDNS 返回 一 个 KingCDN 域 的 主机 名 ， 如 al105. kingedn. com, 

4) 从 这 时 起 ，DNS 请 求 进入 了 KingCDN 专用 DNS 基础 设施 。 用 户 的 LONS 则 发 送 第 

个 请 求 ， 此 时 是 对 al 105. kingcdn. com 的 DNS 请 求 ，KingCDN 的 DNS 系统 最 终 同 LONS 
返回 KingCDN 内 容 服 务 需 的 了 正 地 址 。 所 以 正 是 在 这 里 ， 在 KingCDN 的 DNS 系统 中 ， 指 定 
了 CDN 服务 硕 ， 客 户 将 能 够 从 这 台 服 务 硕 接收 到 它 的 内 容 。 

5) LDNS 向 用 户主 机 转发 内 容 服 务 CDN gisi IP hs 

6) 一 日 客 户 收 到 KingCDN 内 容 服务 器 的 IP 地 址 , 它 与 具有 该 下 地 址 的 服务 更 创建 
了 一 条 直接 的 TCP 连接 ， 并 且 发 出 对 该 视频 的 HTTP CET 请 求 。 如 果 使 用 了 DASH, E% 
器 将 首先 向 客户 发 送 具 有 URL 列表 的 告示 文件 ， 每 个 URL 对 应 视频 的 每 个 版 本 ， 并 且 客 
户 将 动态 地 选择 来 自 不 同 版 本 的 二 
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图 7-4 DNS 将 用 户 的 请 求 重 定 癌 到 一 台 CDN AR th 


2. 集群 选择 策略 

任何 CDN 部 署 ， 其 核心 是 集群 选择 策略 (cluster selection strategy), ， 即 动态 地 将 客户 
定向 到 CDN 中 服务 器 集群 或 数据 中 心 的 机 制 。 如 我 们 刚才 所 见 ，CDN 经 过 客户 的 DNS A 
找 得 知 了 pe 服务 器 的 IP 地 址 。 在 得 知 该 IP 地 址 之 后 ，CDN ii HEF IX IP ih 
址 选择 一 个 适当 的 集群 。CDN 一 般 采 用 专用 的 集群 选择 策略 。 我 们 现在 简单 地 介绍 一 些 日 
然 的 策略 ， ig Te A 其 优点 和 缺点 。 

一 种 简单 的 策略 是 指派 客户 到 地 理 上 最 为 邻近 (geographically closest) 的 集群 。 使 用 
商用 地 理 位 置 数据 库 (例如 Quova | aie 2012 | 和 Max- Mind | MaxMind 2012]), ， 每 个 
LDNS IP 地 址 都 映射 到 一 个 地 理 位 置 。 当 从 一 个 特殊 的 LDNS 接收 到 一 个 DNS 请 求 时 ， 
CDN 选择 地 理 上 最 为 接近 的 集群 ， 即 离 LDNS 几 千 米 远 的 集群 ,“ 就 像 马 飞 一 样 " 。 这 样 的 
解决 方案 对 于 众多 用 户 来 说 能 够 工作 得 相当 好 [ Agarwal 2009 | 。 但 对 于 某 些 客户 ， 该 解决 
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方案 可 能 执行 的 效果 差 ， 央 为 地 理 最 邻近 的 集群 可 能 并 不 是 沿 着 网 络 路 径 最 近 的 集群 此 
外 ， 一 种 所 有 基于 DNS 的 方法 都 内 在 县 有 的 问题 是 某 些 病 用 户 配 置 使 用 位 于 远 地 的 LDNS 
Shaikh 2001: Mao 2002 | ， 在 这 种 情况 下 ，LDNS 位 置 可 能 远离 客户 的 位 置 。 此 外 .这 种 


而 单 的 采 略 和 忽略 了 时 延 和 可 用 市 宽 随 因特网 路 径 时 间 而 变化 ， 总 是 为 特定 的 客户 指派 相同 
的 集群 
为 上 基于 当前 流量 条 件 为 客户 决定 最 好 的 集群 ，CDN 能 够 对 其 集群 和 客户 之 间 的 时 延 


机 天 包 性 能 执行 周期 性 的 实时 测量 (real-time measurement) 。 例 如 ，CDN 能 够 让 它 的 每 个 
集群 周期 性 地 加 位 于 全 世界 的 所 有 LDNS 发 送 探测 分 组 (例如 ，ping 报 文 或 DNS 请 求 ). 
这 种 方法 的 一 个 缺点 是 许多 LDNS 配置 为 不 会 对 这 些 探测 进行 啊 应 。 

发 送 测量 路 径 性 质 的 外 nape 的 另 一 种 方法 是 ， 使 用 客户 与 CDN Se 9 a ia ie Ai 
进行 中 的 流量 特点 ， 例 如 ， 客 户 与 集 铬 之 间 的 时 延 能 够 通过 观察 TCP 三 次 握手 过 程 中 服务 
ar ell & Ft SYNACK 和 客户 到 Far ACK 之 间 的 间 际 进行 估计 。 然 而 ， 这 种 解决 方案 a r 
Di ret FA EE ERRE AJTE., EAEE m A E TREA) 次 优化 集群 。 尽 管 
仅 有 求 需 楼 作为 探测 分 组 而 工作 ,但 选择 的 客户 在 接收 内 容 (视频 或 其 他 ) ven 可 
能 经 受 很 大 的 性 能 下 降 | Andrews 2002; Krishan 2009 | 。 对 于 集群 到 客户 路 径 的 另 一 种 探 
测 方法 是 使 用 DNS 请 求 流 量 来 测量 客户 和 集群 之 间 的 时 延 。 有 具体 而 言 ， 在 DNS FY (在 
7-4 DR 4 中 )， 客 户 的 LDNS 能 够 偶尔 地 定 回 到 不 同 的 权威 DNS AR Ar, AEII Ar 
可 以 安 妆 在 各 个 集群 位 置 , 产生 DNS 流量 ， 这 些 流量 则 能 够 在 LDNS e EZ IH] 
测量 到 ， 使 用 这 种 方案 ，DNS 服务 器 继续 向 该 客户 返回 优化 的 集群 ， 使 得 交付 视频 和 其 他 
Web 对 象 不 会 受到 损害 [Huang 2010 |, 

使 客户 与 CDN 服务 需 匹 配 的 一 种 非常 不 同 的 方法 是 使 用 IP ER (IP anycast) [RFC 
1546 | IP 任 播 基于 的 思想 是 让 因特网 中 的 路 由 需 将 客户 的 分 组 路 由 到 “最 近 的 ”集群 ， 
就 像 由 BGP 决定 的 那样 。 具 体 而 言 ， 如 图 7-5 中 所 示 ， 在 IP 任 播 配置 阶段 ，CDN 公司 为 
它 的 每 个 集群 指派 相同 的 IP 地 址 ， 并 且 使 用 标准 的 BOP 从 每 个 不 同 的 集群 位 置 来 通告 该 
IP 地 址 。 当 一 个 BGP 路 有 由 大 接收 到 对 这 个 相同 的 IP 地 址 的 多 个 路 由 通告 时 ， 它 对 行 这 些 

通告 就 像 对 相同 的 物理 位 置 提 供 了 不 同 的 路 径 (事实 上 ， 在 这 个 时 候 ， 这 些 通告 对 不 同 的 
srs MOU SRP ORE). 遵循 标准 的 操作 过 程 ， 则 BGP PH tia Fe ig AS Hh Hh A PE 
机 制 MK IP 地 址 选择 “最 好 的 ”( 例 如 最 近 的 ， 就 像 AS 跳 计 数 所 决定 的 那样 ) 路 由 
例如 ， 如 果 一 个 BGP 路 由 (对 应 于 一 个 位 置 ) 离 该 路 由 需 仅 一 个 AS 跳 的 距离 ， 并 且 所 有 
其 他 BGP 路 由 《对 应 于 其 他 位 置 ) 是 两 个 或 更 多 AS 跳 ， 则 BGP 路 由 右 将 通常 选 择 使 分 
组 路 由 到 需要 仅 通 过 一 个 AS 的 位 置 (参见 4.6 节 )。 在 这 个 初始 配置 阶段 后 ，CDN 能 够 
从 事 内 容 分 发 的 主要 工作 。 当 任何 客户 要 观看 任何 视频 时 ，CDN 的 DNS 返回 该 任 播 地 址 ， 
而 无论 该 客户 位 于 何 处 。 当 客户 癌 该 IP 地 址 发 送 分 组 时 ， 该 分 组 被 路 由 到 “最 近 的 ” 集 
群 。， 如 同 由 预先 配置 的 转发 表决 定 的 那样 ， 该 转发 表 用 BGP 进行 配置 ， 如 刚才 摘 述 的 那 
样 ， 这 种 方法 有 具有 如 下 优点 ， 发 现 的 集群 最 靠近 客户 而 不 是 最 靠近 该 客户 的 LDNS. 然而 ， 
IP 任 播 策 略 仍 末 顾 及 因特网 在 短 时 间 抱 围 内 的 动态 性 质 | Ballani 2006 | 。 

涩 了 诸如 时 延 、 丢 包 和 审 宽 性 能 等 网 络 相 关 考 虑 外 ， 在 设计 集群 选择 策略 时 还 有 许多 
BAERE, 集群 上 的 负载 就 是 一 个 这 样 的 因素 ， 即 客户 不 应 当 定 加 到 过 载 的 集 
HE. ISP 交付 成 本 是 另外 一 个 因素 ， 即 可 以 选择 特定 的 集群 ， 使 得 用 特定 的 ISP 承载 CDN 
Fe PA Tate, HEIL EN ISP 和 集群 操作 者 之 间 的 契约 关系 中 的 不 同 的 成 本 结构 。 
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图 7-5 使 用 IP 任 播 将 客户 路 由 到 最 近 的 CDN 集群 





7.2.5 学 习 案例 : Netflix, YouTube 和 “看 看 ” 


通过 观察 三 个 高 度 成 功 的 大 规模 公司 : Netflix、YouTube 和 “看 看 ”， 我 们 来 总 结 流 式 
存储 视频 的 讨论 。 我们 将 看 到 ， 这 些 系统 采用 的 方法 差异 很 大 ， 但 却 应 用 了 在 本 节 中 讨论 
的 许多 支撑 原则 ， 

1. Netflix 

Netflix 在 2011 年 产生 了 几乎 30% 的 美国 因特网 下 载 流 量 ， 它 已 经 成 为 美国 首届 一 指 
的 在 线 电 影 和 TV 节目 的 服务 提供 商 [ Sandvine 2011]。 为 了 迅速 地 部 署 它 的 大 规模 服务 ， 
Netflix 已 经 广泛 地 使 用 了 第 三 方 的 去 服务 和 CDN。Netflix 的 确 是 部 署 大 规模 在 线 服 务 的 有 
趣 典范 ， 它 通过 从 第 三 方 租 用 服务 器 、 人 带宽、 存储 和 数据 库 服务 而 几乎 不 使 用 任何 目 己 的 
基础 设施 。 下列 讨论 节选 自 可 读 性 很 强 的 Netflix 体系 结构 测量 研究 [ Adhikari 2012 | 。 如 
我 们 将 看 到 的 那样 Netflix 应 用 了 本 节 前 面 涉及 的 许多 技术 ， 包 括 使 用 一 个 CDN (实际 上 
EZA CDN) 的 视频 分 发 和 经 HTTP 的 适应 性 流 。. 

图 7-6 显示 了 Netflix 视频 流 平 台 的 基本 体系 结构 。 它 具有 四 个 主要 构件 : 注册 和 文 付 
服务 器 、 亚 马 逊 云 、 多 个 CDN 提供 商 和 客户 。 在 它 自己 的 硬件 基础 设施 中 ，Netflix 维护 
注册 和 支付 服务 器 ,这些 服务 器 处 理 新 账户 的 注册 和 捕获 信用 卡 文 付 信息 。 除 了 这 些 基本 
的 功能 外 ，Netflix 通过 利用 亚马逊 云 中 的 机 器 (或 虚拟 机 ) 来 运行 它 的 在 线 服务 。 在 亚 马 
还 云 中 发 生 的 某 些 功能 包括 : 

e 内 容 摄取 。 在 Netflix 能 够 回 它 的 用 户 分 发 某 电影 之 前 ， 它 必须 首先 摄取 和 处 理 该 

电影 。Netflix 接收 电影 的 制 片 厂 母 带 ， 并 且 将 其 上 载 到 亚马逊 云 中 的 主机 上 。 

e 内 容 处 理 。 亚 马 逊 云 中 的 机 咒 为 每 部 电影 生成 许多 不 同 格式 ， 适 合 于 不 同类 型 的 客户 

视频 播放 器 在 桌面 计算 机 、 智 能 手机 和 与 电视 机 相连 的 游戏 机 上 运行 。 为 每 种 不 同 格 
式 和 比特 率 的 视频 都 生成 一 种 不 同 的 版 本 ， 人 允许 使 用 DASH 经 HTTP 适应 性 播放 流 。 
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e 向 CDN LAMA- 一 旦 某 电 影 的 所 有 版 本 均 已 生成 在 亚马逊 云 中 的 主机 将 回 
CDN 上 和 载 这 些 版 本 .。 
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图 7-6 Netflix 视频 流 平台 


为 了 回 其 用 户 按 震 交付 电影 ，Netflix 广泛 地 使 用 了 CDN 技术 - 事实 上， 在 2012 年 本 
书写 作 时 ，Netflix 没有 应 用 一 个 自己 的 CDN， 但 却 同时 使 用 了 3 个 第 三 方 CDN 公司 ， 即 
Akamai, Limelight 和 Level-3 。 

描述 了 Netflix (KAZE RAY ZA F, RIKERA — BP RIRA Ar AYN 
Fr, TREN SS ARS ACTA. DE Netflix 视频 库 的 Web K) ot HOR AW Sy ith 2s PY Hi 
务 带 提供 服务 。 当 用 户 选 择 一 个 电影 准备 “现在 播放 ”， 该 用 户 也 从 亚 马 进 云 中 的 服务 杂 
获得 了 一 个 告示 文件 .该 告示 文件 提供 了 各 种 各 样 的 信息 ， 包 括 CDN 的 等 级 列表 和 对 于 
不 同 版 本 电影 的 URL， 这 些 都 被 用 于 DASH 重 放 。CDN 的 等 级 由 Netflix 决定 ， 并 且 可 能 
随 流 式 会 话 的 改变 而 变化 。 客 户 通 常 将 在 告示 文件 中 选择 等 级 最 高 的 CDN。 在 客户 选择 一 
A CDN 后 ，CDN 促使 DNS 将 客户 重 定 向 到 一 个 特定 的 CDN 服务 器 ， 如 7.2.4 节 所 述 。 该 
客户 和 那 台 CDN 服务 器 则 使 用 DASH 进行 交互 。 具 体 而 言 ， 如 7.2.3 Wark, APEH 
HTTP GET 请 求 报 文中 的 字 节 范围 首部 ， 以 请 求 来 自 电 影 的 不 同 版 本 的 块 。Netflix 使 用 大 
24 秒 长 的 块 [Adhikari 2012 ] 。 随 痢 这 些 块 的 下 载 ， 客 户 测量 收 到 的 在 吐 量 并 且 运 行 一 
个 速率 确定 算法 来 确定 下 一 个 请 求 块 的 质量 。 

Netflix 包含 了 本 节 前 面 讨论 的 许多 关键 原则 ， 包 括 适 应 性 流 和 CDN 分 布 。Netflix 也 很 
好 地 前 明了 一 个 产生 Fa 30% 因特网 流量 的 主要 因特网 服务 能 够 几乎 完全 在 第 三 方 云 和 第 

=J CDN 基础 设施 上 运行 ， 却 几乎 不 必 使 用 上 自己 的 基础 设施 的 情况 1 

2. YouTube 


在 YouTube 的 库 中 有 大 约 5 亿 个 视频 ， 并 且 每 天 有 5 亿 次 视频 观看 | Ding 2011), Æ 
无 疑问 YouTube 是 世界 上 最 大 的 视频 共享 站 点 。YouTube 2005 年 4 月 开始 它 的 服务 ， 并 
于 2006 年 11 月 被 谷歌 公司 收购 。 尽 管 谷 歌 /YouTube 设计 和 协议 是 专用 的 ， 但 通过 几 项 独 
立 的 测量 结果 ， 我 们 能 够 基本 理解 YouTube 的 工作 原理 | Zink 2009; Torres 2011; 
Adhikari 2011a | - 

与 Netflix 一 样 ，YouTube 广泛 地 利用 CDN 技术 来 分 发 它 的 视频 | Torres 2011]. 然而 ， 
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与 Netflix 不 同 的 是 ， 谷 歌 不 应 用 第 三 方 CDN， 而 是 使 用 自己 的 专用 CDN 来 分 发 YouTube 
视频 .谷歌 在 效 自 个 不 同 的 位 置 安 闻 了 服务 硕 集 群 ， 从 这 些 位 置 的 子 集 (大 约 有 50 个 ) 
分 发 YouTube 视频 | Adhikari 2011a]。 谷歌 使 用 DNS 将 用 户 请 求 重 定 问 到 一 个 特定 的 集 
RF, 407.2.4 TIIR, 在 大 部 分 时 间 中 ， 人 谷歌 的 集群 选择 策略 将 客户 定 同 到 使 客户 与 集群 
之 间 的 RTT 最 低 的 集群 ; 然而， 为 了 平衡 器 集群 的 负载 ， 有 时 客户 也 被 定 问 (经 DNS) 
到 一 个 更 远 的 集群 [Torres 2011 ] 。 此 外 ， 如 果 一 个 集群 不 有 具有 请 求 的 视频 ， 该 集群 并 不 
是 从 某 个 别 的 地 方 获 取 该 视频 并 中 继 给 客户 ， 而 是 可 能 返回 一 个 HTTP 重 定 向 报 文 ， 从 而 
将 该 客户 重 定 癌 到 为 一 个 集群 [Torres 2011 | 。 

YouTube 应 用 HTTP 流 ， 如 7.2.2 市 中 所 讨论 的 。YouTube 经 常 使 少量 的 不 同 版 本 为 
一 个 视频 可 用 ， 每 个 具有 不 同 的 比特 率 和 对 应 的 质量 等 级 。 到 了 2011 年 ，YouTube 没有 应 
用 适应 性 流 (例如 DASH ) ， 而 要 求 用 户 人 工 选择 一 个 版 本 。 为 了 节省 那些 将 被 重 定位 或 
提前 终止 而 浪费 的 带宽 和 服务 器 资源 ，YouTube 在 获取 视频 的 目标 量 之 后 ， 使 用 HTTP 字 
万 范 围 请 求 来 限制 传输 的 数据 流 。 

每 天 有 几 百 万 视频 被 上 载 到 YouTube。 不 仅 YouTube 视频 经 HTTP 以 流 方 式 从 服务 需 
到 客户 ， 而 且 YouTube 上 载 者 也 经 HTTP 从 客户 到 服务 右上 载 他 们 的 视频 。YouTube 处 理 
它 收 到 的 每 个 视频 ， 将 它 转 换 为 YouTube 视频 格式 并 且 创 建 具 有 不 同比 特 率 的 多 个 版 本 。 
这 种 处 理 完 全 发 生 在 谷歌 数据 中 心 。 因 此 ， 安 观 地 对 比 Netflix, Netflix 几乎 完全 在 第 三 方 
基础 设施 上 运行 ， 而 谷歌 在 它 目 己 巨大 的 基础 设施 上 运行 整个 YouTube 服务 ， 该 基础 设施 
是 由 数据 中 心 、 专 用 CDN 和 互联 其 数据 中 心 的 专用 全 球 网 络 和 CDN 集群 构成 的 。 (参见 
7.2.4 二 中 有 关 谷 歌 的 网 络 基础 设施 的 学 习 案 例 。) 

我 们 刚才 看 过 了 Netflix 和 YouTube 服务 ， 由 CDN (或 者 第 三 方 或 者 专用 CDN) 运行 
的 服务 兹 以 流 的 方式 把 视频 传送 给 客户 。Netflix 和 YouTube 不 仅 必 须 为 服务 器 硬件 付费 
(通过 目 己 拥有 直接 付费 ， 或 者 通过 租用 间接 付费 ) ， 而 且 要 为 服务 器 分 发 视频 时 使 用 的 带 
宽 付 费 。 鉴 于 这 些 服务 的 规模 和 它们 消耗 的 带宽 量 ， 这 种 “客户 -服务 器 ”的 部 署 代价 是 
极 高 的 。 

我 们 通过 描述 一 种 完全 不 同 的 方法 来 总 结 本 市 内 容 ， 即 大 规模 经 因特网 提供 按 需 视 
频 。 这 是 一 种 允许 服务 提供 商 极 大 地 减少 其 基础 设施 种 宽 成 本 的 方法 。 如 你 可 能 猜测 的 
那样 ， 这 种 方法 使 用 PP 交付 ， 而 不 是 客户 - 服务 器 (经 CDN) 交付 。 几 个 中 国 的 公司 
非常 成 功 地 使 用 了 P2P 视频 交付 ， 包 括 “ 看 看 ”( 由 迅雷 公司 拥有 并 运行 ) PPTV (以 前 
为 PPLive) 和 “ 皮 上 肥 ”( 以 前 为 PPstream ) 。“ 看 看 ”当前 是 首屈一指 的 基于 P2P 按 需 视频 
的 中 国 提供 商 ， 每 月 有 超过 2000 万 不 同 的 用 户 观看 它 的 视频 。 

在 一 个 高 层面 看 ，P2P 视频 流 非常 类 似 于 BitTorrent 附件 下 载 (在 第 2 章 讨论 过 )。 当 
一 个 对 等 方 要 看 一 个 视频 时 ， 它 联系 一 个 跟踪 器 ( 它 可 能 是 集中 式 的 ,或 者 是 使 用 DHT 
的 基于 对 等 方 的 ) ， 以 发 现在 系统 中 具有 该 视频 副本 的 其 他 对 等 方 。 这 个 对 等 方 则 并 行 地 
从 具有 该 文件 的 这 些 其 他 对 等 方 请 求 该 视频 文件 中 的 块 。 然 而 ， 不同 于 使 用 BitTorrent 下 
载 ， 请 求 被 优先 地 给 予 那 些 即将 播放 的 块 ， 以 确保 连续 的 播放 。 

“看 看 ”设计 应 用 了 一 个 跟踪 器 和 它 自 己 的 DHT 来 跟踪 内 容 。 对 于 最 流行 内 容 的 蜂 群 
规模 涉及 数 万 对 等 方 ， 通 名 大 于 BitTorrent 中 的 最 大 蜂 群 [ Dhungel 2012], “GA” AYP) 
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以 部 是 专用 的 ， 这 些 协 以 用 于 对 等 方 和 跟踪 大 之 间 、 对 等 方 和 DHT 之 间 和 对 等 方 之 间 的 
通信 。 有 趣 的 是 ， 为 了 在 对 等 方 之 半分 发 视频 块 ,“ 看 看 ”每 当 可 能 时 前 使 用 UDP, ic 
致 在 中 国 的 因特网 中 有 巨 量 的 UDP 流量 | Zhang M 2010 | 。 


7.3 IP 语 音 


经 因特网 的 实时 会 话 式 语音 经 常 被 称 为 因特网 电话 (Internet telephony) ， 因 为 从 用 户 
的 视角 看 ， 它 类 似 于 传统 的 电路 交换 电话 服务 。 它 通常 也 被 称 为 IP 语音 (Voice- over- IP, 
VolP), 在 本 节 中 我 们 描述 VoIP 所 依据 的 原则 和 协议 。 会话 式 视频 在 许多 方面 类 似 于 
VoIP， 除 了 它 包 括 参 与 者 的 视频 以 及 他 们 的 语音 以 外 .为 了 使 讨论 重点 突出 且 具 体 ， 我 们 
这 里 仅 关 注 语音 ， 而 不 是 语音 和 视频 的 结合 . 
7.3.1 尽力 而 为 服务 的 限制 

因特网 的 网 络 层 协议 IP 提供 了 尽力 而 为 的 服务 ， 那 就 是 说 服务 尽 全 力 将 每 个 数据 报 
从 源 尽 可 能 快 地 移动 到 目的 地 ， 但 是 没有 就 在 某 些 时 延 界限 内 使 分 组 到 达 目 的 地 或 丢 包 百 
分 比 的 限制 做 任何 承诺 。 缺 失 这 种 保证 对 实时 会 话 式 应 用 的 设计 提出 了 严峻 挑战 ， 这 些 应 
用 对 分 组 时 延 、 时 延 幸 动 和 丢 包 非常 敏感 。 


在 本 节 中 ， 我 们 将 讨论 加 强 尽 力 而 为 网 络 上 的 VoIP 性 能 的 几 种 方式 我 们 的 重点 
将 在 应 用 层 技术 上 ， 即 这 些 技术 并 不 要 求 在 网 络 核心 甚至 在 端 系统 的 运输 层 有 任何 变 


化 。 为 了 使 讨论 具体， 我 们 将 讨论 在 一 个 特定 的 VoIP 例子 环境 下 尽力 而 为 IP 服务 的 限 
制 。 发 送 方 以 每 秒 8000 字 节 的 速率 产生 字 节 ， 且 每 20ms 将 字 节 汇聚 成 块 。 每 个 块 和 一 
个 特殊 的 首部 〈 在 下 面 讨 论 ) 封装 在 一 个 UDP 报 文 段 中 (通过 一 个 到 套 接 字 接 口 的 呼 
叫 ) ， 因 此 ， 一 个 块 中 的 字 节 数 为 (20ms) x(8000 “Fi / FP) = 160 字 节 ， 每 20ms 发 送 
一 个 UDP 报 文 段 。 

如 果 每 个 分 组 以 恒定 的 端 到 端 时 延 到 达 接 收 方 ， 那 么 分 组 每 隔 20ms 就 能 周期 性 地 到 
达 接 收 方 。 在 这 种 理想 的 情况 下 ， 只 要 每 个 块 一 到 达 ， 接 收 方 就 能 直接 播放 它 。 但 不 六 的 
是 ， 东 些 分 组 可 能 丢失 ， 大 多 数 分 组 没有 相同 的 端 到 端 时 延 ， 即 使 在 一 个 轻 度 拥塞 的 因 特 
网 中 也 是 如 此 。 因 此 ， 接 收 方 必须 更 仔细 地 判断 : 山 什 么 时 候 播放 一 个 块 ; QAI fay Lh BE 
TERR. 

1. ZU 

考虑 由 VoIP 应 用 产生 的 一 个 UDP 报 文 段 。 这 个 UDP 报 文 段 封装 在 IP 数据 报 中 。 当 
数据 报 在 网 络 中 人 徘徊 时 ， 在 等 待 出 链 路 传输 时 它 要 经 过 路 由 带 的 缓存 ( 即 队列 ) 。 从 发 送 
方 到 接收 方 的 路 径 上 的 一 个 或 多 个 缓存 有 可 能 是 满 的 ， 不 能 接纳 该 IP 数据 报 。 在 这 种 情 
况 下 ， 这 个 IP 数据 报 就 被 丢弃 了 ， 永 远 不 会 到 达 接 收 方 的 应 用 程序 。 

通过 TCP ( 它 提 供 了 了 可靠 数据 传输 ) 而 不 是 UDP 发 送 分 组 可 以 消除 丢失 。 然 而 ， 重 
传 机 制 对 于 诸如 VoIP 这 样 的 会 话 式 实时 音频 应 用 ， 通常 认为 是 不 可 接受 的 ， 因 为 它们 增 
加 了 端 到 端 时 延 | Bolot 1996 ] 。 此 外 ， 当 丢 包 后 ， 由 于 TCP 的 拥塞 控制 ， 发 送 方 的 传输 速 
率 可 能 减少 到 低 于 接收 方 的 排 空 速率 ， 可 能 导致 缓存 “饥饿 ”这 可 能 会 对 接收 方 的 语音 
可 理解 程度 产生 严重 影响 。 由 于 这 些 原 因 ， 几 乎 所 有 现 有 的 VoIP 应 用 默认 运行 在 UDP 
E. | Baset 2006] 报告 称 Skype 使 用 了 UDP， 除 非 用 户 位 于 阻碍 UDP 报 文 段 的 NAT 或 防 
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火 墙 之 后 〈 这 时 使 用 TCP). 

但 是 分 组 的 丢失 并 不 一 定 会 造成 人 们 想象 中 的 灾难 。 实 际 上 ， 取 决 于 霹 音 是 如 何 编 但 
和 传输 的 以 及 接收 方 隐藏 丢 包 的 方式 ，1% ~ 20% 的 丢 包 率 是 可 以 处 受 的 。 例 如 ， 前 问 纠 
错 (FEC) 能 够 有 助 于 隐藏 丢 包 。 我 们 后 面 可 以 看 到 ， 通 过 使 用 FEC， 将 元 余 信 息 和 初始 
信息 一 起 传输 ， 以 使 能够 从 元 余 信息 中 恢复 一 些 于 失 的 初始 数据 。 无 论 如 何 ， 如 果 发 送 方 
和 接收 方 之 间 的 一 段 或 多 段 链 路 严重 拥 蹇 ， 丢 包 率 超过 10% ~20% (例如 在 无 线 链 路 
上 ) ， 那 么 无 论 采 取 何 种 措施 都 无 法 获得 可 以 接受 的 声音 质量 了 。 显 然 ， 尽 力 而 为 服务 有 
它 的 局 限 性 。 

2. iia BN dial bf uk 

端 到 端 时 延 (end-to-end delay) Æ PIN A ASL GR ae PAIE, ADA BA 
延 ， 链 路 中 的 传播 时 延 和 端 系 统 的 处 理 时 延 。 对 于 实时 会 话 式 应 用 ， 例 如 VolP, Wr pit 
人 对 于 小 于 150ms AY im El sap lly Ze Fe oe BE JN BUA: 在 150ms 和 400ms 之 间 的 时 年 能 够 接受 ， 
但 是 不 够 理想 ; 超过 400ms 的 时 延 可 能 严重 妨碍 语音 谈话 的 交互 性 。YoP 应 用 程序 的 接 
收 方 通常 忽略 时 延 超 过 特定 国 值 (例如 超过 400ms) 的 任何 分 组 ， 因 此 ， 时 延 超 过 该 国人 
的 分 组 等 效 于 丢弃 。 

3. 分 组 时 延 抖动 

端 到 端 时 延 的 一 个 关键 成 分 是 一 个 分 组 在 网 络 路 由 大 中 经 历 的 变化 的 排队 时 延 。 巾 于 
这 些 可 变 的 时 延 ， 从 在 源 中 产生 分 组 到 它 在 接收 方 收 到 的 这 段 时 间 ， 对 于 不 同 的 分 组 可 能 
会 有 波动 ， 如 图 7-1 所 示 。 这 个 现象 称 为 时 延 拌 动 (jitter)。 淮 一 个 例子 ， 考 不 在 VolP 应 
用 中 两 个 连续 的 分 组 。 发 送 方 在 发 送 第 一 个 分 组 20ms 之 后 发 送 第 二 个 分 组 ,但 是 在 接收 
方 ， 这 两 个 分 组 之 间 的 间隔 可 能 变 得 大 于 20ms。 为 了 理解 这 一 点 ， 假 设 第 一 个 分 组 到 达 
路 由 需 的 一 个 几乎 为 空 的 队列 ， 但 是 恰好 在 第 二 个 分 组 到 达 该 队列 之 前 ， 从 其 他 源 来 的 大 
量 分 组 也 到 达 了 相同 的 队列 。 因 为 在 这 个 路 由 需 中 第 一 个 分 组 经 受 了 很 小 的 排队 时 延 ， 而 
第 二 个 分 组 经 受 了 较 大 的 排队 时 延 ， 这 两 个 连续 的 分 组 之 间 的 时 间 间 隅 变 得 大 于 20ms 了 
两 个 连续 分 组 的 间隔 也 可 能 会 小 于 20ms。 为 了 理解 这 种 情况 ， 再 次 考虑 两 个 连续 的 分 组 ， 
假设 第 一 个 分 组 加 入 一 个 有 大 量 分 组 队列 的 队 尾 ， 并 且 第 二 个 分 组 到 达 这 个 队列 时 第 一 个 
分 组 尚未 被 传输 ， 而 且 来 自 其 他 源 的 分 组 尚未 到 达 该 队列 。 在 这 种 情况 下 ， 这 两 个 分 组 发 
现 它 们 在 队列 中 互相 紧 挨 着 。 如 果 在 路 由 需 的 出 链 路 传输 一 个 分 组 所 需 时 间 小 于 20ms， 
则 第 一 个 分 组 和 第 二 个 分 组 的 间隔 就 变 得 小 于 20ms 了 。 

这 种 情况 可 以 与 在 公路 上 开车 相 类 比 。 假 设 你 和 你 的 朋友 每 人 驾驶 一 辆 车 从 半 地 亚 凡 
| RUE. 并 且 假 设 你 和 朋友 有 类 似 的 驾驶 风格 ， 而 且 你 们 都 以 交通 规则 允许 的 100km/h 
的 速度 驾驶 。 如 果 你 的 朋友 在 你 之 前 一 个 小 时 出 发 ， 那 么 根据 干扰 车 流量 的 不 同 ， 你 可 能 
在 你 的 朋友 之 后 一 个 小 时 左右 到 达 风 凰 城 . 

如 末 接 收 方 忽略 了 时 延 抖 动 的 存在 ， 一 旦 该 块 到 达 就 开始 播放 ， 那 么 在 接收 方 产生 的 音 
频 质 量 很 容易 变 得 不 可 理解 。 侠 运 的 是 ， 时 延 拌 动 通常 可 以 通过 使 用 序号 (sequence num- 
ber), RHEE? (timestamp) 和 播放 时 延 (playout delay) 来 消除 ， 如 下 面 所 讨论 的 内 容 


7.3.2 在 接收 方 消除 音频 的 时 延 样 动 
对 于 VoIP 应 用 ， 周 期 性 地 产生 分 组 ， 接 收 方 应 该 在 存在 随机 网 络 时 延 拌 动 的 情况 下 
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SAE SAO IR. eA a aR PPL fll RS : 
e 为 每 个 块 预先 计划 一 个 时 间 惟 (timestamp) 。 发 送 方 用 每 个 块 产 生 的 时 刻 为 它 加 上 
时 间 印 记 
e 在 接收 方 延 迟 播放 (delaying playout) 块 。 如 我 们 前 面 在 图 7-1 的 讨论 所 见 ， 接 收 
的 音频 块 的 播放 时 延 必须 足够 长 ， 以 便 大 多 数 分 组 在 它们 的 预定 播放 时 间 之 前 被 
接收 到 。 这 个 播放 时 延 可 能 在 整个 音频 会 话 期 间 是 固定 的 ， 或 者 在 音频 会 话 生 全 
期 中 适应 性 地 变化 。 

我 们 现在 讨论 如 何 纺 合 这 两 种 机 制 来 减轻 甚至 消除 时 延 抖 动 的 影响 。 我 们 研究 两 种 播 
BORME: 固定 播放 时 延 和 适应 性 播放 时 延 ， 

1. 固定 播放 时 延 

使 用 固定 播放 时 延 策 略 ， 接 收 方 试图 在 块 产生 正好 g ms 后 播放 它 。 因 此 如 果 一 个 块 
在 时 刻 :打上 时 间 崔 ， 接 收 方 在 时 刻 上 +9 播放 这 个 块 ， 假 设 这 个 块 在 那个 时 间 已 经 到 达 
在 预定 播放 时 间 之 后 到 达 的 分 组 将 被 丢弃 ， 并 被 认为 已 经 丢失 . 

q 选择 什么 值 为 好 呢 ?”VolP 能 够 支持 高 达 约 400ms 的 时 延 ， 尽 管 使 用 更 小 的 9 值 可 以 
获得 更 令 人 满意 的 会 话 体验 。 男 一 方面 ， 如 果 q HE 400ms 小 得 多 ， 那么 由 于 网 络 引 入 的 分 
组 时 延 抖 动 会 使 许多 分 组 可 能 错过 了 它们 的 预定 播放 时 间 。 概括 地 说 ， 如 采 冰 到 请 时 延 经 
第 发 生 大 的 变化 ， 用 一 个 大 的 g 更 好 ; 另 一 方面 ， 如 果 时 延 很 小 并 且 时 延 变化 也 很 小 ， 用 
一 个 较 小 的 、 可 能 小 于 150ms 的 9 更 好 。 

在 图 7-7 中 说 明了 播放 时 延 和 丢 包 之 间 的 折 中 。 该 图 表示 了 单个 话音 突 峰 期 的 分 组 产 
生 和 播放 的 时 间 。 考 虑 了 两 种 不 同 的 初始 播放 时 延 。 如 最 左边 的 阶梯 所 示 ， 友 送 方 以 规则 
的 间 隅 (比方 说 每 20ms) 产生 一 组 分 组 。 在 这 个 话 首 突 峰 期 中 的 第 一 个 分 组 在 时 刻 r 被 
接收 到 。 如 该 图 所 示 ， 由 于 网 络 时 延 拌 动 ， 后续 分 组 的 到 达 间 隔 是 不 均匀 的 ， 
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图 7-7 不 同 的 固定 播放 时 延 情况 下 的 丢 包 


对 于 第 一 个 播放 调度 时 间 ， 冉 定 的 初始 播放 时 延 设置 为 p-r。 使 用 这 个 方案 ， 第 四 个 
分 组 没有 在 它 调度 的 播放 时 间 到 达 ， 接 收 方 认为 它 丢 失 了 了。 对 于 第 二 个 调度 时 间 ， 固 定 的 
初始 播放 时 延 设置 为 p' -rs 对 于 这 个 方案 ， 所 有 分 组 都 在 它们 调度 的 播放 时 间 之 前 到 达 ， 
因此 没有 丢失 。 
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2. 适应 性 播放 时 延 

上 面 的 例子 显示 了 当 使 用 固定 播放 时 延 来 设计 播放 策略 时 所 引起 的 重要 的 时 延 与 丢 包 
折 中 。 若 初始 播放 时 延 设 置 得 比较 大 ， 大 多 数 分 组 能 在 它们 的 截止 时 间 内 到 达 ， 因 此 存在 
的 丢失 将 可 忽略 不 计 ; 然而 ， 对 于 如 VoIP 这 样 的 会 话 式 服务 ， 长 时 延 即 使 不 是 不 能 人 怒 受 
的 ， 至 少 也 是 令 人 厌恶 的 。 在 理想 情况 下 ， 我 们 希望 播放 时 延 最 小 化 ， 使 丢 包 低 于 一 定 百 
分 比 的 限制 

处 理 这 种 折 中 的 自然 方法 是 估计 网 络 时 延 和 网 络 时 延 变 化 ， 并 且 在 每 个 话音 突 峰 期 的 
开始 相应 地 调整 播放 时 延 。 在 话音 突 峰 期 开始 时 适应 性 地 调整 播放 时 延 将 导致 发 送 方 静默 
期 的 压缩 和 拉 长 ; SAI. ARBRE AY 7b JE a AAR CE IR PEAS SD ot BEY 

根据 [ Ramjee 1994 ] ， 我 们 现在 摘 述 一 种 接收 方 可 以 用 于 适应 性 地 调整 它 的 播放 时 延 
的 通 几 算法。 为 此 ， 令 

,= 第 i 个 分 组 的 时 间 鹤 = 该 分 组 在 发 送 方 产 生 的 时 间 

r; = 分 组 i 饿 接收 方 接收 的 时 间 

= 分 组 i 在 接收 方 播 放 的 时 间 

Ei i i pa ennai -1,。 由 于 网 络 时 延 拌 动 ， 这 da 分 组 之 
间 会 发 生变 化 ” 令 d; 表示 接收 到 第 i 个 分 组 时 的 平均 网 络 时 延 的 估计 值 。 这 个 估计 值 根据 
如 下 的 时 间 鹤 来 构造 : 

d; = (1 = + u(r, =e) 
式 中 是 一 个 同 定 的 常数 (例如 ，u = 0.01), eR d, 是 观察 到 的 网 络 时 延 mm 一 4 ，… 
7 一 4 的 一 个 平滑 均值 。 这 个 估计 值 为 最 近 观 察 到 的 网 络 时 延 设 置 了 比 过 去 一 段 时间 观 察 到 
的 网 络 时 延 有 更 大 的 权重 。 这 种 佑 值 的 形式 不 应 该 是 完全 阳 生 的 ; 相似 的 思想 在 第 3 草 讨 
论 估计 TCP 往返 时 间 时 就 使 用 过 - So, 表示 与 估计 平均 时 延 的 平均 时 延 绝 对 偏差 的 估计 
值 . 这 个 估计 值 也 可 从 这 些 时 间 惟 构建 : 
ü = (1 -u)v +ulr, -t, -d, | 

为 每 个 接收 的 分 组 计算 估计 值 d; 和 习 ， 尽 管 它们 仅 能 用 于 为 任何 话音 突 峰 期 的 第 一 个 
分 组 确定 播放 点 。 

一 旦 计算 完了 这 些 估计 值 ， 接 收 方 为 分 组 播放 应 用 下 列 的 算法 。 如 果 分 组 i 是 一 个 话 
音 突 峰 期 的 第 一 个 分 组 ， 它 的 播放 时 间 p, 计算 如 下 : 

p; = t, +d, + Ko, 

这 里 大 是 一 个 正 的 常数 (CPG KK =4). Ko, 项 的 目的 是 给 将 来 设置 足够 大 的 播放 时 间 ， 

便 话音 突 峰 期 中 只 有 一 小 部 分 到 达 的 分 组 由 于 述 到 而 丢失 。 在 一 个 话音 突 峰 期 中 任何 后 
分 组 的 播放 点 被 计算 为 对 于 这 个 话音 突 峰 期 的 第 一 个 分 组 播放 时 间 点 的 侯 移 。 特别 是 ， 令 
qi = Pit 
表示 从 话音 突 峰 期 的 第 一 个 分 组 产生 到 它 播放 的 时 间 长 度 。 如果 分 组 /也 属于 这 个 话音 突 

峰 期 ， 它 播放 的 时 刻 是 
Py =o FG, 
刚才 描述 的 算法 在 假设 接收 方 能 够 辨 明 一 个 分 组 是 否 是 话音 突 峰 期 中 的 第 一 个 分 组 的 
情况 下 很 有 意义 。 这 能 够 通过 检查 每 个 接收 到 的 分 组 中 的 信和 号 能 量 来 做 到 。 
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7.3.3 从 丢 包 中 恢复 


我 们 已 经 较为 详细 地 讨论 了 一 个 VoIP 应 用 能 够 怎样 处 理 分 组 时 延 抖 动 。 我 们 现在 简 
要 地 摘 述 在 存在 丢 包 的 情况 下 几 种 试 网 保护 可 接受 的 音频 质量 的 方案 。 这 样 的 方案 被 称 为 
丢 包 恢复 方案 (1oss recovery scheme) 。 这 里 我 们 定义 了 广义 的 丢 包 : 如 果 某 分 组 不 能 到 达 
接收 方 或 者 在 它 调度 的 播放 时 间 之 后 才 到 达 ， 该 分 组 则 丢失 。 我 们 再 次 用 VoIP 例子 作为 
描述 于 包 恢 复方 案 的 环境 ， 

如 在 本 节 开 始 提 到 的 那样 ， 在 诸如 VoIP 等 会 话 式 实时 应 用 中 ， 重 传 于 失 的 分 组 通常 
是 不 可 行 的。 的 确 ， 重 传 一 个 已 经 错过 了 播放 截止 时 间 的 分 组 是 绝对 没有 意义 的 。 A E 
传 一 个 在 路 由 带 队 列 溢出 的 分 组 通常 不 能 足够 快 地 完成 。 由 于 这 些 考虑 ，VolP 应 用 通常 
使 用 某 种 类 型 的 丢 包 预期 方案 。 两 种 类 型 的 丢 包 预期 方案 是 前 向 纠 错 (Forward Error Cor- 
rection, FEC) 与 交织 (interleaving) 。 

1 前 癌 纠 错 

PEC 的 基本 思想 是 给 初始 的 分 组 流 增 加 宛 余 信息 。 以 稍微 增加 传输 速率 为 代价 ， 这 些 
元 余 信息 可 以 用 来 重建 一 些 丢 失 分 组 的 近似 或 者 准确 版 本 。 根 据 文献 [ Bolot 1996] 和 
| Perkins 1998 | ， 我 们 现在 概括 了 两 种 简单 的 FEC 机 制 。 第 一 种 机 制 是 每 发 送 n 个 块 之 后 
发 送 一 个 元 余 编 码 的 块 。 这 个 克 余 块 通过 异 或 n 个 初始 块 来 获得 [Shacham 1990]， 以 这 
种 方式 ， 在 这 n+1 个 分 组 的 组 中 ， 如 果 任 何 一 个 分 组 丢失 ， 接 收 方 能 够 完全 重建 丢失 的 
分 组 。 但 是 如 果 这 一 组 中 有 两 个 或 更 多 分 组 丢失 ， 接 收 方 则 无 法 重建 丢失 的 分 组 。 通过 让 
组 的 长 度 n+1 比较 小 ， 当 丢失 不 是 很 多 时 ， 大 部 分 丢失 分 组 都 可 以 恢复 。 然 而 组 的 长 度 
越 小 ， 相 对 增加 的 传输 速率 就 越 大 。 特 别 是 奉 传 输 速 率 以 1/n 因子 增加 的 话 ， 例 如 n=3， 
则 传输 速率 增加 33% 。 此外， 这 个 简单 的 方案 增加 了 播放 时 延 ， 因 为 接收 方 在 能 够 开始 播 
放 之 前 ， 必 须 等 待 收 到 整个 组 的 分 组 。 有 关 FEC 在 多 媒体 传输 上 如 何 工 作 的 更 多 实践 细节 
参见 [RFC 5109], 

第 二 个 FEC 机 制 是 发 送 一 个 较 低 分 辩 率 的 音频 流 作 为 元 余 信 息 . 例 如， 发 送 方 可 能 创 
建 一 个 标 称 的 音频 流 和 一 个 相应 的 低 分 辨 率 、 低 比特 率 的 音频 流 。 (这 个 标 称 流 可 能 是 一 
个 64kbps 的 PCM 编码 ， 而 这 个 较 低 质量 的 流 可 能 是 一 个 13kbps 的 GSM 编码 。) 这 个 低 比 
特 率 流 被 认为 是 见 余 信息 。 如 图 7-8 所 示 ， 发 送 方 通过 从 这 个 标 称 流 中 取出 第 nn 个 块 并 附 
加 上 第 (n -1) 个 块 的 匈 余 信息 ， 以 构建 第 n 个 分 组 。 以 这 种 方式 ， 只 要 没有 连续 分 组 的 
丢失 ， 接 收 方 都 可 以 通过 播放 和 后 续 分 组 一 起 到 达 的 低 比 特 率 编码 块 来 隐藏 于 失 。 当 人 然 ， 
低 比特 率 块 比 标 称 块 的 质量 要 低 。 然 而 ， 在 一 个 流 主要 是 由 高 质量 块 组 成 、 偶 尔 出 现 低 质 
量 块 并 且 没 有 丢失 的 块 的 情况 下 ， 其 整体 的 音频 质量 良好 。 注 意 到 在 这 种 方案 中 ， 接 收 方 
在 播放 前 只 需 接 收 两 个 分 组 ， 因 此 增加 的 时 延 小 。 此 外 ， 如 果 低 比特 率 编码 比 标 称 编码 少 
得 多 ， 那 么 传输 速率 的 额外 增加 并 不 大 ， 

为 了 处 理 连续 丢失 ， 我 们 能 够 使 用 率 一 个 简单 的 修正 方案 。 发 送 方 不 再 仅 为 第 n AER 
称 块 附加 上 第 (n-1) 个 低 比特 率 块 ， 而 是 附加 上 第 (n-1) 个 和 第 (n -2) 个 低 比特 
率 块 ， 或 者 附加 第 (n -1) 个 和 第 (n -3) 个 低 比特 率 块 等 等 。 通 过 给 每 个 标 称 块 附加 
上 更 多 低 比 特 率 块 ， 在 各 种 恶劣 的 尽力 而 为 服务 环境 下 接收 方 的 音频 质量 变 得 可 接受 。 在 
另 一 方面 ， 附 加 的 块 增加 了 传输 带宽 和 播放 时 延 。 
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图 7-8 撒 带 低 质 量 的 元 余 信息 


2. ZH 

作为 元 余 传 输 的 另 一 种 替代 方案 ，VolP 应 几 可 以 发 送 交 织 的 音频 。 如 图 7-9 所 示 ， 发 
送 方 在 传输 之 前 对 音频 数据 单元 重新 排序 ， 使 得 最 初 相 邻 的 单元 在 传 御 流 中 以 一 定 距离 了 
离开 来 。 交 织 可 以 减轻 于 包 的 影响 例如， 如 果 每 个 单元 长 为 Sms， 块 是 20ms (也 就 是 每 
个 块 4 个 单元 ) ， 那 么 第 一 个 块 可 能 包含 1、5、9 和 13 单元， 第 二 个 块 可 能 包含 2、6 、10 
和 14 单元 等 等 。 图 7-9 显示 了 一 个 交织 流 的 单个 于 包 导致 重建 流 中 的 多 个 小 间隙， 这 与 
在 非 交 织 流 中 将 会 叶 臻 单个 大 间 际 形成 对 照 。 





图 7-9 发 送 交 织 音 频 
交织 能 够 明显 地 提高 音频 流 可 感觉 到 的 质量 | Perkins 1998], 它 的 开销 也 较 低 交织 
够 很 好 地 处 理 流 式 存储 音频 。 交 织 的 一 个 主要 优点 是 它 不 增加 流 的 带宽 需求 。 
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1998| 中 讨论 的 那样 ， 因 为 音频 信号 (特别 是 语音 ) 呈现 出 大 量 的 短期 目 相 似 性 ， 故 该 
方案 是 可 行 的 。 正 因为 如 此 ， 这 些 技术 适合 于 工作 在 相对 小 的 去 包 率 〈 低 于 15%) 和 小 
分 组 (4 ~40ms) 的 情 次 。 当 丢失 长 度 接近 音素 的 长 度 (5 ~ 100ms) 时 ， 这 些 技术 就 失效 
了 ， 因 为 束 个 音素 可 能 被 听 者 错过 。 

也 许 基 于 接收 方 的 恢复 的 最 商 单 方式 是 分 组 重复 。 即 用 在 丢失 之 前 刚 到 达 的 分 组 的 副 
本 来 代替 丢失 的 分 组 。 这 种 方法 的 计算 复杂 度 低 ， 并 且 工 作 得 相当 好 。 基 于 接收 方 恢复 的 
刃 一 种 形式 是 内 插 法 ， 它 使 用 在 丢失 之 前 和 之 后 的 音频 内 插 形 成 一 个 合适 分 组 来 隐藏 于 
失 ， 内 插 法 比分 组 重复 稍微 好 一 些 ， 但 是 显然 需要 更 高 的 计算 强度 [ Perkins 1998 ] 。 


7.3.4 学 习 案 例 : 使 用 Skype 的 VolP 


Skype 是 一 个 非常 流行 的 VoIP 应 用 ， 每 天 都 有 超过 5000 万 个 活跃 的 账户 。Skype 除了 
提供 主机 到 主机 的 VoIP 服务 ， 还 提供 主机 到 电话 的 服务 ， 电 话 到 主机 的 服务 ， 以 及 多 方 
主机 到 主机 的 视频 会 议 服务 。 (这 里 ， 主 机 仍然 是 任 一 种 因特网 连接 IP 设备 ， 包 括 PC, 
平板 电脑 和 智能 手机 。) Skype 于 2011 年 由 微软 公司 出 资 超过 80 亿美 元 收购 。 

因为 Skype 协 以 是 专用 的 ， 并 且 因 为 所 有 Skype 的 控制 和 媒体 分 组 是 加 密 的 ， 所 以 精 
确 地 确定 Skype 的 工作 过 程 是 非常 困难 的 。 无 论 如 何 ， 从 Skype 的 Web 网 站 和 几 项 测量 研 
究 ， 人 研究 人 员 已 经 知道 了 Skype 总 体 上 是 怎样 工作 的 [ Baset 2006; Guha 2006; Chen 
2006; Suh 2006; Ren 2006; Zhang X 2012 | 。 对 于 语音 和 视频 ，Skype 客户 都 有 许多 自行 
文 配 的 不 同 编 解 码 硕 ， 这 些 编 解 但 瑚 能 够 以 宽泛 的 速率 和 质量 对 媒体 进行 编码 。 例 如 ， 测 
量 表 明 Skype 的 视频 速率 从 用 于 低 质量 会 话 的 低 至 30kbps 到 用 于 高 质量 会 话 的 高 至 1Mbps 
左右 | Zhang X 2012 |。 一 般 而 言 ，Skype 语 首 质 量 好 于 由 有 线 电话 系统 提供 的 “POTS 
( 简单 老式 电话 服务 ) ”的 质量 。( Skype 编 解码 器 通常 以 16 000 样本 / 秒 或 更 高 速率 对 语音 
抽样 ， 这 提供 比 POTS 更 为 丰富 的 音色 ，POTS 的 抽样 率 为 8000/ 秒 ,) 在 默认 状态 下 ， 
Skype 通过 UDP 发 送 音 频 和 视频 分 组 。 然 而 ， 控 制 分 组 经 TCP 发 送 ， 并 且 当 防火 墙 阻挡 
UDP 流 时 ， 媒 体 分 组 也 通过 TCP AIK, Skype 对 于 经 UDP 发 送 的 语音 和 视频 流 使 用 FEC 
处 理 丢 包 恢 复 。Skype 客户 还 通过 改变 视频 质量 和 FEC 开销 ， 使 它 所 发 送 的 音频 和 视频 流 
适应 当前 的 网 络 情况 [Zhang X 2012 ] 。 

Skype 以 一 些 创 新 方式 使 用 P2P 技术 ， 很 好 地 阐述 了 P2P 是 如 何 应 用 于 除 内 容 分 发 和 
文件 共享 之 外 的 应 用 中 的 。 如 同 即 时 讯 县 那样 ， 主 机 到 主机 因特网 电话 应 用 的 核心 内 在 地 
应 用 了 P2P 扩 本 ， 因 为 用 户 对 〈 即 对 等 方 ) 彼此 实时 通信 。 但 是 Skype 也 对 两 个 其 他 重要 
功能 应 用 了 P2P 技术 ， 这 两 个 功能 是 用 户 定位 和 NAT 穿越 。 

如 图 7-10 所 示 ，Skype 中 的 对 等 方 (EHL) 组 织 成 为 一 个 等 级 制 覆 善 网 络 ， 其 中 每 个 
对 等 方 分 类 为 超级 对 等 方 和 普通 对 等 方 。Skype AEP — PAG, ARIK Skype 用 户 名 映 
OY “AWAY IP Heh (和 端口 号 ) 。 该 索引 经 过 超级 对 等 方 分 发 。 当 Alice 要 呼叫 Bob 时 ， 
她 的 客户 搜索 该 分 布 式 索引 以 决定 Bob 的 当前 了 下地 址 。 因 为 Skype 协议 是 专用 的 ， 所 以 当 
前 并 不 知道 该 案 引 映射 是 怎样 跨越 这 些 超 级 对 等 方 进行 组 织 的 ， 尽 管 采 用 某 种 形式 的 DHT 
组 织 结构 是 非常 可 能 的 。 

P2P 技术 也 被 用 于 Skype 中 继 (relay) 中 ， 中 继 对 于 创建 家 庭 网 络 中 主机 之 间 的 呼叫 
是 有 用 的 .许多 家 庭 网 络 配置 提供 通过 NAT 接 人 因特网 ， 如 第 4 章 所 讨论 的 那样 。 前 面 
讲 过 NAT 防止 来 目 家 庭 网 络 外 部 的 主机 发 起 的 对 家 庭 网 络 内 部 主机 的 连接 。 如 果 两 个 
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Skype 呼叫 方 都 具有 NAT， 则 存在 一 个 问题 ， 即 任 一 方 都 不 能 接受 由 其 他 一 方 发 起 的 呼叫 ， 
使 得 呼叫 看 起 来 不 可 能 实现 。 明 智 地 使 用 超级 对 等 方 和 中 继 很 好 地 解决 了 这 个 问题 。 假 设 
当 Alice 注册 进入 系统 ， 她 被 指派 了 一 个 非 NAT 的 超级 对 等 方 并 对 那个 超级 对 等 方 发 起 一 
个 会 话 。( 因为 是 Alice 发 起 了 该 会 话 ， 所 以 她 的 NAT 允许 该 会 话 -.) 这 个 会 话 允 许 Alice 
和 她 的 超级 对 等 方 交 换 控 制 报 文 。 当 Bob 注册 进入 系统 时 发 生 了 同样 的 事情 。 此 时 ， 当 
Alice 要 呼叫 Bob, ， 她 通知 她 的 超级 对 等 方 ， 超 级 对 等 方 依次 通知 Bob 的 超级 对 等 方 ，Bob 
的 超级 对 等 方 依次 通知 Bob 说 “Alice 的 人 呼叫 到 了 WMR Bob 接受 了 该 呼叫 ， 这 两 个 超 
级 对 等 方 选择 一 个 第 三 方 非 NAT 超级 对 等 方 ( 即 中 继 对 等 方 ) ， 中 继 对 等 方 的 工作 是 中 继 
Alice 和 Bob 的 数据 。Alice 和 Bob 的 超级 对 等 方 则 分 别 指 示 Alice 和 Bob 与 该 中 继 发 起 会 
话 。 如 图 7-10 Pras, Alice 则 经 过 “Alice 到 中 继 ” 连 接 回 该 中 继 发 送 寺 音 分 组 〈 该 连接 
HH Alice 发 起 ) ， 并 且 该 中 继 经 “中 继 到 Bob ”连接 转发 这 些 分 组 (该 连接 由 Bob 发 起 ) ; 
从 Bob 到 Alice 的 分 组 反方 回 地 流 经 相同 的 两 条 中 继 连 接 。 瞧 ! Bob 和 Alice 有 了 一 条 闯 到 
闹 连 接 ， 即 使 他 们 都 不 能 接受 一 条 源 于 外 部 的 会 话 。 
被 叫 对 等 方 
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5 主 叫 对 等 方 


图 7-10 Skype 对 等 方 


到 现在 为 止 ， 我 们 有 关 Skype 的 讨论 关注 涉及 两 人 的 呼叫 。 现 在 我 们 观察 多 方 音频 会 议 
呼叫 。 对 于 N >2 个 参与 者 ， 如 果 每 个 用 户 希 望 同 每 个 其 他 NN -1 个 用 户 发 送 它 的 音频 流 的 一 
个 副本 ， 则 为 支持 该 音频 会 议 总 共 N(N -1) 个 音频 流 将 需要 发 送 到 网 络 中 去 。 为 了 减少 这 
种 带宽 使 用 ，Skype 应 用 了 一 种 明智 的 发 送 技术 。 具体 而 言 ， 每 个 用 户 向 会 议 发 起 方 发 送 它 
的 音频 流 。 会 议 发 起 方 将 这 些 音 频 流 结合 为 一 个 流 (基本 上 是 将 所 有 的 音频 信号 加 在 一 起 )， 
然后 再 向 每 个 其 他 N -1 个 参与 者 发 送 每 个 结合 流 的 一 个 副本 ， 以 这 种 方式 ， 流 的 数量 被 减 
少 到 2(N-1) 条 。 对 普通 的 两 人 视频 会 议 ，Skype 路 由 对 等 方 到 对 等 方 呼叫 ， 除 非 需 要 NAT 
穿越 ， 此 时 呼叫 通过 一 个 非 NAT 对 等 方 中 继 ， 如 前 面 所 述 。 对 于 一 个 涉及 N >2 个 参与 者 的 
视频 会 议 呼叫 ， 由 于 视频 媒体 的 性 质 ，Skype 不 像 对 语音 呼叫 那样 在 一 个 位 置 将 呼叫 结合 进 
一 条 流 中 ， 然 后 将 流 回 所 有 参与 者 重新 分 发 . 相反 ， 每 个 参与 者 的 视频 流 被 路 由 到 一 个 服务 
Arsene (2011 年 该 服务 需 集 群 位 于 爱沙尼亚 ) ， 该 集群 依次 将 N-1 个 其 他 参与 者 的 N-1 条 
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流 中 继 到 每 个 参与 者 | Zhang X 2012], MARERE A ARENS HA Dd RS Ak TTT AS E [in] B} 
个 其 他 YX -1 其 他 参与 者 直接 发 送 其 视频 流 的 副本 呢 ? 的 确 ， 对 两 种 方法 而 言 ，XCX -1) 个 
视频 流 正 由 会 议 中 的 N 个 参与 者 共同 接收 。 其 原因 是 ， 在 大 多 数 接 和 人 链 路 中 上 行 链 路 市 宽 比 
下 行 链 路 带宽 要 低 得 多 ， 上 行 链 路 可 能 不 能 文 持 使 用 P2P 方法 的 NN-1 条 流 ，。 

i 4 Skype, QQ 和 Google Talk 等 VoIP 系统 引入 了 新 的 隐私 性 关注 。 具 体 而 言 ， 当 
Alice fl Bob 经 过 VoIP 通信 ，Alice 能 够 咱 探 到 Bob 的 IP 地址， 进而 使 用 地 理 定位 服务 
| MaxMind 2012; Quova 2012 | 来 确定 Bob 的 当前 位 置 和 1ISP (例如 他 的 工作 或 家 庭 ISP). 
FE, Alice 使 用 Skype 能 够 在 呼叫 创建 期 间 阻 挡 特 定 的 分 组 传输 ， 这 样 她 获得 Bob 当前 
(比如 说 每 个 小 时 ) AY TP bhk. m Bob 并 不 知道 他 正 被 跟踪 ， 并 且 Alice 不 在 Bob 的 接触 
列表 上 此外， 从 Skype 发 现 的 IP 地 址 能 被 关联 到 在 BitTorrent 中 发 现 的 IP 地 址 ， 因 此 
Alice 能 够 确定 Bob 正在 下 载 的 文件 | LeBlond 2011]。 此 外 ,通过 进行 流 中 分 组 长 度 的 流 
量 分 析 ， 可 能 部 分 解密 一 个 Skype 呼叫 [ White 2011] 


7.4 实时 会 话 式 应 用 的 协议 


实时 会 话 式 应 用 (包括 VoIP 和 视频 会 议 ) 引人入胜 并 且 非 常 流行 。 因 此 标准 机 构 如 
IETF 和 ITU 多 年 来 一 直 忙 于 而且 要 继续 忙 下 去 !) 知心 推 殴 这 类 应 用 的 标准 是 毫 不 奇怪 
的 。 借 助 于 实时 会 话 式 应 用 的 适当 标准 ， 各 个 独立 公司 正在 创造 新 的 能 够 互相 操作 的 产品 。 在 
本 节 中 ， 我 们 探讨 用 于 实时 会 话 式 应 用 的 RTP 和 SIP。 这 两 个 标准 正 广泛 地 应 用 于 工业 产品 中 。 


7.4.1 RTP 


在 前 一 节 中 ， 我 们 知道 VolP 应 用 的 发 送 端 在 将 块 传递 给 运输 层 之 前 为 它们 附加 上 上 让 
部 字段 。 这 些 首 部 字段 包括 ] biti enh HARKER AS DH] 28 H RES AI HIF AA 
HERR, KEA ae SET] A Be H Ab TEA H E Er AIER HE oP 
组 结构 是 方便 的 。 定义 在 RFC 3550 中 的 RTP 就 是 这 样 一 个 标准 。RTP AEW H FIE fi H 
KR, 如 用 于 声音 的 PCM 、ACC 和 MP3 ， 用 于 视频 的 MPEGC 和 H. 263。 它 也 可 以 用 于 传输 
专用 的 声音 和 视频 格式 。 HAT, RTP 在 许多 产品 和 人 研究 原型 中 得 到 广泛 实现 。 它 也 是 其 他 
重要 的 实时 交互 协 以 〈 如 at nuke 
本 节 我 们 介绍 RTP. 我 们 也 鼓励 读者 去 访问 Henning Schulzrinne 的 RTP 站 点 [ Schul- 
zrinne-RTP 2012 | , ee 关 这 个 主题 的 很 多 信息 。 读者 也 可 以 访问 RAT 站 点 
| RAT 2012 | ， 它 记载 了 使 用 RTP 的 VoIP 应 用 ， 


1. RTP 基础 

RTP 通常 运行 在 UDP 之 eng RTP 分 组 中 封装 媒体 块 ， 然 后 在 UDP 报 文 段 中 
封装 该 分 组 ， 然后 将 该 报 文 段 给 IP. 接收 端 从 UDP 报 文 段 中 提取 出 这 个 RTP 分 组 ， 
然后 从 RTP 分 组 中 提取 出 媒体 块 ， AA te eee 


举例 来 说 ， 考 虑 使 用 RTP 来 传输 语音 。 假 设 语 音源 采用 了 64kbps 的 PCM 编码 (twi 
是 采样 、 量 化 和 数字 化 ) 。 再 假设 应 用 程序 在 20ms 块 中 收集 这 些 编码 数据 ， 也 就 是 一 个 块 
中 有 160 字 节 。 发 送 端 在 每 个 声音 数据 块 的 前 面 加 上 一 个 RTP (RTP header) ， 这 个 
首部 包括 音频 编码 的 类 型 、 序 号 和 时 间 玲 。RTP 首部 通常 是 12 字 节 。 音 频 块 和 RTP 和 有 部 
一 起 形成 RTP 分 组 (RTP packet). Ja UDP 套 接 字 接 ee RTP 分 组 。 在 接收 站 ， 
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应 用 程序 从 它 的 套 接 字 接口 收 到 该 RTP 分 组 ， 从 RTP 分 组 中 提取 出 该 音频 块 ， 并 且 使 用 
RTP 分 组 的 首部 字段 来 适当 地 解码 和 播放 该 音频 块 。 

如 果 一 个 应 用 程序 集成 了 RTP 一 一 而 非 一 个 提供 负载 类 型 、 序 号 或 者 时 间 截 的 专用 方 
案 ， 则 该 应 用 程序 将 更 容易 和 其 他 网 络 的 多 媒体 应 用 程序 互 操 作 ， 例如 ， 如 果 两 个 不 同 的 
公司 者 开发 VoIP 软件 ， 并 且 都 在 它们 的 产品 中 集成 了 RTP， 则 希望 使 用 一 种 VoIP 产品 的 
用 户 能 够 和 使 用 另 一 种 VoIP 产品 的 用 户 进 行 通信 。 在 7.4.2 二 ,我 们 将 看 到 RTP 经 党 和 
SIP 一 起 使 用 ，SIP 是 一 种 因特网 电话 的 重要 标准 。 

应 该 强调 的 是 ，RTP 并 不 提供 任何 机 制 来 确保 数据 的 及 时 交付 ， 或 者 提供 其 他 服务 质量 
(QoS) 保证 ; 它 基 至 不 保证 分 组 的 交付 ， 或 防止 分 组 的 失 序 交付 。 RTP 封装 的 东西 确 仅 为 端 
系统 所 见 、 路 由 融 不 区 分 携带 RTP 分 组 的 IP 数据 报 和 不 携 市 RTP 分 组 的 IP 数据 报 ， 

RTP 允许 为 每 个 源 (例如 一 淋 照 相机 或 者 一 个 麦克 风 ) 分 配 一 个 它 日 己 的 独立 RTP 
分 组 流 . 例如 ， 对 于 在 两 个 参与 者 之 间 的 一 个 视频 会 议 ， 可 能 打开 4 个 RTP 流 ， 即 两 个 流 
传输 音频 (一 个 方向 一 个 )， 两 个 流传 输 视频 (也 是 一 个 方向 一 个 )。 然 而 ， 在 编码 过 程 
中 很 多 流行 的 编码 技术 (包括 MPEG1 和 MPEG2) 将 音频 和 视频 拥 绑 在 单个 流 中 。 当 音频 
和 视频 与 编码 名 拥 绑 时 ， 每 个 方 回 只 产生 一 个 RTP 流 。 

RTP 分 组 并 非 限 用 于 单 播 应 用 ， 它 们 也 可 以 在 一 对 多 和 多 对 多 的 多 播 树 上 发 送 。 对 于 

个 多 对 多 的 多 播 会 话 ， 所 有 的 会 话 发 送 方 和 源 通 常 使 用 同样 的 多 播 组 来 发 送 它们 的 RTP 
流 。 在 一 起 使 用 的 RTP 多 播 流 ， 例 如 在 视频 会 以 应 用 中 从 多 个 发 送 方 发 出 的 音频 和 视频 
流 ， 同 属于 一 个 RTP 会 话 (RTP session). 

2. RTP 分 组 首部 字段 

如 网 7-11 Aros, 4 个 主要 的 RTP 分 组 首部 字段 是 有 效 载 傈 类 型 、 厅 写 、 时 间 鹤 和 源 
标识 什 字 有 段 。 





AARNO ee ”其 他 字 眉 


图 7-11 RTP 首部 字段 


RTP 分 组 中 的 有 效 载 千 类 型 字段 的 长 Ea :7 比特 。 对 于 音频 流 ， 有 效 载 傈 类 型 字段 用 
F ja as fE) 用 的 音频 编码 类 型 (例如 PCM, i oe HESS tee ed hl. eA OU ati) WMR GK 
方 在 会 证 过 程 中 决定 改变 编码 ， 发 送 方 可 以 通过 该 有 效 载 和 伍 类 型 字段 来 通知 接收 方 这 种 变 
化 : See ym Hea ata TAS A OK Be r ir er Mot ee oe Ua] RTP 流 比特 率 ,， 表 7-2 列 出 了 
“A RTP 文 持 的 一 些 音频 有 效 载 何 类 型 . 
表 7-2 RTP 支持 的 一 些 音 频 有 效 载 荷 类 型 











有 效 载荷 类 型 编号 采样 速率 速率 
0 PLM ff 8kHz 64kbps 

OO | 1016 4. Bkbps 
3 | GSM 13kbps 

| LPC 2. 4kbps 














9 6.722 16kHz 48 ~ 64kbps 
14 MPEG 音频 90kHz — 


15 G. 728 SkHz l6kbps 
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对 于 一 个 视频 流 ， 有 效 载荷 类 型 用 于 指示 视频 编码 类 型 (例如 运动 JPEG 、MPEC1、 
MPEGC2 H. 261 ) ， 发 送 方 也 可 以 在 会 话 期 间 动 态 改 变 视 频 编 权 。 表 7-3 列 出 了 了 当前 RTP 
支持 的 一 些 视频 有 效 载荷 类 型 。 


# 7-3 RIP ZEMA RL RK fog 














有 效 载荷 类 型 编号 视频 格式 有 效 载荷 类 型 编号 视频 格式 
26 运动 JPEG MPEG 视频 
其 他 重要 的 字段 如 下 : 
e 序号 字段 。 序 号 字段 长 为 16 比特 。 每 发 送 一 个 RTP 分 组 则 该 序号 增加 1， 而且 接 


eNe 来 检测 丢 包 和 恢复 分 组 序列 .例如 ， 如 果 应 用 的 接收 方 收 到 的 
RTP 分 组 流 在 序号 86 和 89 之 间 存 在 一 个 间 险 ， 那 么 接收 方 则 知道 分 组 87 和 88 于 
失 了 。 那 么 接收 方 能 够 设法 来 隐藏 该 丢失 数据 , 

e 时 间 堆 字段 。 时 间 崔 字段 长 32 比特 。 它 反映 了 RTP BCH PZ PAN a PE TYR 
样 时 刻 。 如 我 们 在 上 一 节 所 见 ， 接 收 方 能 够 使 用 时 间 鹤 来 去 际 网 络 中 引入 的 分 组 
时 延 拌 动 ， 提 供 接 收 方 的 同步 播放 。 时 间 惟 是 从 发 送 方 的 采样 时 钟 中 获得 的 。 举 
例 来 说 ， 对 于 音频 的 每 个 采样 周期 (例如 对 于 8kHz 的 采样 时 钟 每 125ps 为 一 个 后 
期 ) 时 间 惟 时 钟 增加 1; 如 果 该 音频 应 用 产生 由 160 个 编码 采样 组 成 的 块 的 后 ， 那 
么 当 源 激活 时 ， 对 每 个 RTP 分 组 则 时 间 截 增加 160。 即 使 源 示 激活， 该 时 间 稚 时 
钟 也 将 继续 以 恒定 速率 增加 。 

e 同步 源 标 识 符 (SSRC). SSRC 字段 长 为 32 比特 。 它 标识 了 RTP 流 的 源 。 在 
RTP 会 话 中 的 每 个 流 都 有 一 个 不 同 的 SSRC。SSRC 不 是 发 送 方 的 耳 地 址 ， 而 是 妆 
新 的 流 开始 时 源 随 机 分 配 的 一 个 数 。 两 个 流 被 分 配 相 同 SSRC 的 概率 是 很 小 的 ul 
果 发 生 了 ， 这 两 个 源 应 当选 择 一 个 新 的 SSRC 值 。 


7.4.2 SIP 


定义 在 | RFC 3261; RFC 5411] 中 的 会 话 发 起 协议 (Session Initiation Protocol, SIP) 
是 一 个 开放 和 轻型 的 协议 ， 其 功能 如 下 : 
o 提供 了 在 主 叫 者 和 被 叫 者 之 间 经 IP 网 络 创建 呼叫 的 机 制 。 它 允许 主 叫 独 通 知 被 叶 
者 它 要 开始 一 个 呼叫 。 它 允许 参与 者 约定 媒体 编码 ， 也 人 允许 参与 者 结束 呼叫 。 
e 提供 了 主 叫 者 确定 被 叫 者 的 当前 IP 地 址 的 机 制 . 因为 用 户 可 能 动态 地 分 配 到 地 址 
(使 用 DHCP) ， 而 且 因 为 它们 可 能 有 多 个 IP 设备 ， 每 个 都 有 一 个 不 同 的 IP 地 址 ， 
所 以 用 户 不 具有 单一 的 、 冉 定 的 IP 地 址 。 
o 提供 了 用 于 呼叫 管理 的 机 制 ， 这 些 机 制 包括 在 呼叫 期 间 增加 新 媒体 流 、 在 呼叫 期 
间 改 变 编 码 、 在 呼叫 期 间 邀 请 新 的 参与 者 、 呼 叫 转移 和 呼叫 保持 等 。 
1. 向 已 知 IP 地 址 建立 一 个 呼叫 
为 了 理解 SIP 的 本 质 ， 最 好 看 一 个 具体 的 例子 。 在 这 个 例子 中 ，Alice 在 使 用 PC， 并 
上 且 她 要 呼叫 Bob, Bob 也 在 使 用 PC TE. Alice 和 Bob 的 PC 都 配 有 基于 SIP 的 软件 来 产生 
和 接收 电话 呼叫 。 在 这 个 初始 的 例子 中 ,我 们 将 假设 Alice AGE Bob PC 的 IP 地 址 。 
图 7-12 描 述 了 这 个 SIP 呼叫 建立 的 过 程 。 
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图 7-12 “4 Alice 知道 Bob 的 IP 地址 时 的 SIP 呼叫 建立 过 程 


在 图 7-12 中 ， 我 们 看 到 当 Alice 给 Bob 发 送 一 个 INVITE 报 文 (这 类 似 于 HTTP 请 求 报 
X) 时 ,一 个 SIP 会 话 开 始 了 。 该 INVITE 报 文 通过 UDP 发 送 给 SIP 的 周知 端口 S060，(SIP 
报 文 也 可 以 经 TCP 发 送 .) GR INVITE 报 文 包括 了 对 Bob 的 标识 (bob@ 193. 64. 210. 89) 、 
Alice 当前 IP 地 址 的 指示 、Alice 希望 接收 的 音频 的 指示 (该 音频 以 格式 AVP 0 编码 ， 即 pu 
(E PCM Hih, JE RTP PE), AR tiA E E iO 38060 接收 RTP 分 组 的 指示 。 在 收 
到 了 Alice 的 INVITE 报 文 之 后 ，Bob 发 送 一 个 SIP 啊 应 报 文 (该 报 文 类 似 HTTP 的 啊 应 报 
文 ) 。 该 啊 应 STP 报 文 也 被 发 送 到 SIP wig 1 5060, Bob 的 啊 应 包括 一 个 200 OK 和 他 的 IP 地 
址 的 指示 、 他 和 希望 接收 的 编 翁 和 分 组 化 ， 以 及 音频 数据 应 该 发 送 到 达 的 端口 号 。 注 意 到 在 
文 个 例子 中 ，Alice 和 Bob 准备 使 用 不 同 的 音频 编 介 机制: 要 求 Alice 使 用 GSM 来 对 她 的 
FABE 5. MR Bob 使 用 E PCM 对 他 的 音频 编码 。 在 接收 到 Bob 的 响应 后 ，Alice ji] 
Bob 发 送 SIP 确认 报 文 。 在 这 个 SIP 事务 之 后 ，Bob 和 Alice 可 以 交谈 了 。( 为 了 Sn 
Wt, Fl 7-12 显示 Alice 在 Bob 之 后 说 话 ， 但 是 事实 上 他 们 通常 可 以 同时 进行 交谈 ,) Bob 
会 根据 要 求 对 音频 进行 编码 和 分 组 化 ， 并 将 音频 分 组 发 送 给 IP 地 址 167. 180. 112. 24 的 端 
口号 38060。Alice 也 会 根据 要 求 对 音频 进行 编码 和 分 组 化 ， 并 将 音频 分 组 发 送 给 IP 地 址 
193. 64. 210. 89 AY) vg L145 48753., 
从 这 个 简单 的 例子 我 们 学 到 了 一 些 SIP 的 关键 特性 。 首先 ，SIP EAA Sb I, B 
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发 送 和 接收 SIP 报 文 使 用 了 一 个 不 同 于 发 送 和 接收 媒体 数据 的 套 接 字 。 第 二 ，SIP 报 文本 
丑 是 可 读 的 ASCH, X HTTP 报 文 类 似 。 第 三 ，SIP 要 求 所 有 的 报 文 都 要 确认 ， 因 此 它 能 
IFE UDP 或 者 TCP 上 运行 

在 这 个 例子 中 ， 我 们 考虑 一 下 如 果 Bob 没有 FE PCM 编 解 码 锅 用 于 音频 编 介 将 会 发 
生 什么 情况 ,在 这 种 情况 下 ，Bob 不 用 200 OK 来 啊 应 ， 而 可 能 用 一 个 606 Not Acceptable 
(不 可 接受 ) 来 啊 应 ， 并 在 报 文 中 列 出 他 能 够 使 用 的 所 有 编 解 码 。 然 后 Alice MPa PET 
编 解 人 多， 并 发 送 为 一 个 INVITE 报 文 ， 以 此 通告 了 已 选择 的 编 解 但 项 。Bob 也 能 够 是 接 通 
过 发 送 某 个 拒绝 应 答 代 码 来 直接 拒绝 该 呼叫 。 (有 很 多 这 种 代码 ,包括 “busy CH)” 
“gone (离开 )”、 “payment (付费 ) ”和 “forbidden (禁止 )”-) 

2. SIP 地 址 

在 前 面 的 例子 中 ，Bob 的 SIP 地 址 是 sip: bob@ 193. 64. 210.89. Rm, Fell Hite 
(即使 不 是 大 多 数 ) SIP 地 址 类 似 于 电子 邮件 地 址 。 例 如 ，Bob 的 地 址 可 以 是 sip: bob@ 
domain. com, “4 Alice 的 SIP 设备 发 送 INVITE 报 文 ， 该 报 文 包 括 这 种 类 似 于 电子 邮件 地 址 
的 地 址 ; 然后 SIP 的 基本 设施 将 该 报 文 转发 给 Bob 正在 使 用 的 IP 设备 ( 如 我 们 下 和 面 要 讨 
沦 的 那样 ) 。 其 他 可 能 的 SIP 地 址 形式 可 以 是 Bob 过 去 的 电话 号 码 或 者 只 是 Bob 的 名 字 / 中 
团 名 /姓氏 《假设 它 是 唯一 的 ) 。 

SIP 地 址 的 一 个 有 趣 特点 是 它们 能 够 被 包括 在 Web 页 面 中 ， 就 像 人 们 的 电子 邮件 地 址 用 
mailto URL 形式 包含 在 Web 页 面 中 那样 。 例 如 ， 假 设 Bob 有 个 人 主页 ， 并 且 他 要 为 这 个 主页 的 
沪 问 者 提供 一 个 呼叫 他 的 方法 。 于 是 他 可 能 只 是 在 主页 中 包括 该 URL sip: bob@ domain. com. 
当 访 问 者 点 击 该 URL， 访 问 者 设备 中 的 SIP 应 用 将 局 动 ， 并 问 Bob 发 送 INVITE 报 文 。 

3. SIP HX 

在 这 个 简短 的 SIP 介绍 中 ,我 们 无 法 包括 所 有 SIP 报 文 类 型 和 首部 ， 而 只 是 向 要 地 浏 
vi — F SIP INVITE GR, DR BORAT Bt. Fee Alice 要 对 Bob 发 起 VoIP NF 
叫 ， 此 时 Alice 只 知道 Bob 的 SIP 地 址 bob@ domain. com， 并 不 知道 Bob 正在 使 用 的 设备 的 
IP 地 址 。 那 么 她 的 报 文 可 能 看 起 来 有 些 像 下 面 这 个 : 

INVITE sip:bob@domain.com SIP/2.0 

Via: SIP/2.0/UDP 167.180.112.24 

From: sip:alice@hereway.com 

To: sip:bob@domain.com 

Call-ID: a2e3a@pigeon.hereway.com 


Content-Type: application/sdp 
Content-Length: 885 


c=IN IP4 167.180.112.24 
m=audio 38060 RTP/AVP 0 


这 个 INVITE 行 包括 SIP 的 版 本 ， 这 与 HTTP 请 求 报 文 一 样 。 任 何 时 候 SIP 报 文通 过 一 
个 SIP 设备 〈 包 括 产生 该 报 文 的 设备 ) 时 ， 它 附加 上 一 个 Via 首部 来 指示 该 设备 的 IP 地 
址 。( 我们 不 久 将 看 到 通常 INVITE 报 文 在 到 达 被 叫 者 的 SIP 应 用 之 前 会 通过 很 多 SIP 设 
fr.) 与 电子 邮件 报 文 类 似 ，SIP 报 文 包括 一 个 From 首部 行 和 一 个 To 首部 行 。 该 报 文 包括 
一 个 Call-ID (呼叫 标识 符 ) ， 它 唯一 地 标识 该 呼叫 ( 类似 电子 邮件 中 的 报 文 ID ); 包括 一 
个 Content-Type (内 容 类 型 ) 首部 行 ， 定 义 用 于 描述 包含 在 SIP 报 文 中 的 内 容 的 格式 ; 还 
包括 Content-Length (内 容 长 度 ) 首部 行 ， 提 供 报 文中 内 容 的 字 节 长 度 ， 最 后 ， 在 一 个 回 
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车 和 换行 之 后 ， 该 报 文 包含 内 容 部 分 。 在 这 个 例子 中 ， 内 容 提供 了 有 关 Alice 的 IP 地 址 和 
Alice 要 如 何 接收 该 音频 的 信息 . 

4， 名 宇 翻 兰 和 用 户 定 位 

在 图 7-12 的 例子 中 ， 我 们 假设 Alice 的 SIP 设备 知道 能 够 联系 到 Bob 的 IP 地址。 但 是 
这 种 假设 是 很 不 员 实 的 ,不仅 因为 IP 地 址 通常 是 通过 DHCP 动态 分 配 的 ， 而 且 Bob 可 能 
有 多 个 IP 设备 (例如 ， 在 家 里 、 工 作 中 和 汽车 里 有 不 同 的 设备 )。 因 此 现在 我 们 假设 
Alice 只 知道 Bob 的 电子 邮件 地 址 bob@ domain. com， 而 且 对 基于 SIP 的 呼叫 使 用 同样 的 地 
址 .在 这 种 情况 下 ，Alice 需要 获得 用 户 bob@ domain. com 正在 使 用 的 设备 的 IP 地 址 。 为 
了 获得 它 ，Alice 创建 一 个 INVITE 报 文 ， 它 以 INVITE bob@ domain. com SIP/2.0 开始 ， 并 
将 该 报 文 发 送 给 一 个 SIP 代理 (SIP proxy ) 。 该 代理 将 以 一 个 STP 回答 来 响应 ， 该 回答 中 
也 可 能 包含 bob@ domain. com 正在 使 用 的 设备 的 IP 地址。 该 回答 也 可 以 选择 包括 Bob 的 语 
音信 箱 的 IP 地址， 或 者 可 能 包括 一 个 Web 页 面 的 URL (上 面 写 着 “Bob 在 睡觉 ， 请 不 要 
打扰 1”)。 代 理 返 回 的 结果 也 可 能 取决 于 呼叫 者 : 如 果 呼 叫 是 Bob 的 妻子 发 出 的 ， 它 可 能 
接受 该 呼叫 ， 并 提供 IP 地址; 如 果 呼 叫 是 Bob 的 岳母 发 出 的 ， 它 可 能 用 指向 “我 正在 睡 
WE” AY Web 负面 的 URL Aq hy 

现在 ， 你 可 能 想 知 道 这 个 代理 服务 天 是 怎样 确定 bob@ domain. com 现在 的 IP 地 址 的 ? 
为 了 回答 该 问题 ， 我 们 需要 讲 一 下 另 一 个 SIP 设备 ， 即 SIP 注册 器 (SIP registrar), ^A 
SIP 用 户 都 有 一 个 相关 联 的 注册 需 。 任何 时 候 用 户 在 设备 上 发 起 SIP 应 用 时 ， 该 应 用 给 注 
Mae Ai A SIP 注册 报 文 ， 通 知 注 册 硕 它 现在 的 IP 地 址 ,例如 ， 当 Bob 在 他 的 PDA 上 
发 起 SIP 应 用 时 ， 该 应 用 将 发 送 一 个 类 似 于 下 述 内 容 的 报 文 : 

REGISTER sip:domain.com SIP/2.0 

Via: SIP/2.0/UDP 193.64.210.89 

From: sip:bob@domain.com 


To: sip:bob@domain.com 
Expires: 3600 


Bob HEM arte Bob 现在 的 IP 地址。 无论 何 时 Bob 切换 到 一 个 新 的 SIP 设备 时 ， 该 
新 设备 将 发 送 一 个 新 的 注册 报 文 ， 指 示 该 新 的 IP Hk. Wee Bob 长 时 间 使 用 同样 的 设备 ， 
该 设备 将 发 送 刷 新 注册 报 文 ， 指 示 最 近 发 送 的 IP 地 址 仍然 有 效 。( 在 上 面 的 例子 中 ， 需 要 
BEB 3600 秒 发 送 刷新 报 文 来 维护 在 注册 需 中 的 地 址 。.) 值得 注意 的 是 注册 融和 DNS 权威 
FMR AeA: DNS 服务 硕 将 固定 的 用 户 名 翻译 到 固定 的 下地 址 ; STP 注册 需 把 固定 的 
人 识别 标志 (例如 bob@ domain. com) 翻译 为 一 个 动态 的 IP 地 址 。SIP 注册 需 和 SIP 代理 
通 前 运行 在 同一 台 主 机 上 .: 

现在 我 们 检查 一 下 Alice 的 SIP 代理 服务 需 是 如 何 获得 Bob 当前 的 IP 地 址 的 。 从 上 面 
的 讨论 我 们 看 到 ， 代 理 服务 需 只 需要 转发 Alice AY INVITE 报 文 给 Bob 的 注册 器 /代理 即 可 . 
然后 注册 各 /代理 将 该 报 文 转发 给 Bob 现在 的 SIP 设备 。 最 后 ， 在 已 收 到 了 Alice 的 INVITE 
报 文 之 后 ，Bob 可 以 各 Alice 发 送 一 个 SIP 应 答 。 

举例 来 说 ， 考 虑 图 7-13， 其 中 正在 217. 123.56. 89 上 工作 的 jim@ umass. edu 要 对 正在 
197. 87.54.21 上 工作 的 keith@ upenn. edu 发 起 IP AEF (VoIP) 会 话 。 采 用 下 面 的 步骤 : 
(DJim fo] umass 的 SIP 代理 发 送 INVITE Hx, DIZE SIP 注册 器 upenn. edu 上 进行 
DNS 查询 〈 在 图 中 没有 显示 ) ， 并 将 该 报 文 转发 给 注册 服务 顺 。 吧 因为 keith@ upenn. edu 
没有 在 注册 各 upenn 上 注册 ，upenn 注册 硕 发 送 一 个 重 定 同 应 答 ， 指 示 它 应 该 试 一 试 
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keith@ eurecom. fr, Gdumass 的 代理 向 eurecom 的 SIP 注册 器 发 送 INVITE 报 文 。 Geurecom 


PEM dt ALI keith @ eurecom. fr 的 IP H hk, SIP 注 册 器 

开 将 INVITE 报 文 转发 给 正 运 行 Keith 的 STP Pee 

客户 的 主机 197. 87. 54.21. © ~ Qi chee Mes i 

/代理 把 SIP 啊 应 返回 给 217. 123. 56. 89 上 的 q | 

SIP 客户 。 回 媒体 直接 在 两 个 客户 之 间 发 Or 

送 。( 还 有 一 个 SIP 确认 报 文 ， 图 中 没有 画 SI 代理 / gy ee 


sw 


HK.) 
我 们 有 关 SIP 的 讨论 集中 在 语音 呼叫 





的 呼叫 发 起 方面 ，SIP 通常 是 一 个 发 起 和 结 » 

y aTe A S ( / \ X 
束 呼叫 的 信 令 协议 ， 它 能 够 用 于 视频 会 议 加/ (6) \ 
呼叫 和 基于 文本 的 会 话 。 事实 上 上 ,SIP 已 经 Ag \@ 


成 为 许多 即时 讯 县 应 用 的 基本 组 件 ， 我 们 
就 励 希 望 学 习 更 多 有 关 SIP 知识 的 读者 访 
问 Henning Schulzrinne 的 SIP Web 站 点 





| Schulzrinne-SIP 2012 | ， 特 别 是 ， 你 在 这 个 SIP 客 户 SIP 客 户 
站 点 上 会 发 现 SIP 客户 和 服务 器 的 开源 软 7256 ein 
{F [SIP Software 2012 | 图 7-13 涉及 SIP 代理 与 注册 器 的 会 话 发 起 
7.5 支持 多 媒体 的 网 络 

在 7.2~7.4 节 中 ,我 们 学 习 了 诸如 客户 缓存 、 预 取 、 对 可 用 带宽 的 适应 性 媒体 质量 、 


适应 性 播放 和 丢 包 缓解 技术 等 应 用 级 机 制 如 何 用 于 多 媒体 应 用 ， 以 改善 多 媒体 应 用 的 性 
能 .我 们 也 学 习 了 内 容 分 发 网 和 P2P 覆盖 网 络 如 何 用 于 提供 系统 级 的 交付 多 媒体 内 容 的 方 
法 。 这 些 技术 和 方法 都 被 设计 用 于 今天 的 尽力 而 为 因特网 。 的 确 ， 现 在 因特网 得 到 应 用 就 
是 因为 它 只 提供 单一 的 、 尽 力 而 为 类 型 的 服务 。 但 是 作为 计算 机 网 络 的 设计 者 ， 我 们 么 不 
住 要 问 : 网 络 (而 不 是 应 用 程序 或 者 仅 应 用 级 的 基础 设施 ) 是 否 可 以 提供 支持 多 媒体 内 容 
交付 的 机 制 。 如 我 们 很 快 将 看 到 的 那样 ， 答 案 当 然 是 肯定 的 ! 但 是 我 们 也 将 看 到 ， 许 多 这 
样 的 新 网 络 级 机 制 还 没有 得 到 广泛 部 署 ， 这 可 能 是 由 于 它们 的 复杂 性 和 下 列 事实 所 致 : 应 
用 级 基础 设施 以 及 尽力 而 为 服务 和 适当 定制 的 网 络 资源 〈 例 如 审 宽 ) 的 确 能 够 提供 “ 足 
够 好 的 ”( 即使 不 总 是 尽善尽美 的 ) 疹 到 端 多 媒体 交付 服务 。 
表 7-4 总 结 了 能 够 对 多 媒体 应 用 提供 网 络 级 支持 的 三 种 宽泛 的 方法 。 
表 7-4 支持 多 媒体 应 用 的 三 种 网 络 级 方法 







方法 当前 部 署 








T i YHH FH, CDN, 
尽 可 能 利用 尺 公平 处 理 所 有 应 用 级 支持 











ae ta = BBM, MARR | 最 小 -处 不 在 
Imam 7 it 网 络 级 资 | k] | 无 处 不 在 
不 同类 型 的 流 分 组 标识 ， 监 管 . | 
x4 rj 二 此 
区 最 处 理 不 同 测度 fis me 
每 连接 服务 质 | ”每 个 源 到 目的 -日 流 被 准 入 ， 分 组 标识 ， 监 管 ， 








it (QoS) 保证 地 流 处 理 不 同 软 或 者 看 调度 ， 呼 叫 准 入 和 信 令 | 
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o 尺 可 能 利用 尽力 而 为 服务 .我 们 在 7.2 ~7.4 节 学 习 的 应 用 级 机 制 和 基础 设施 能 够 
成 功 地 用 于 定制 良好 的 网 络 一 一 该 网 络 中 偶然 出 现 于 包 和 过 大 的 端 到 端 时 延 。 妆 预 
风 到 需求 增加 ，ISP 部 署 额外 的 带宽 和 交换 能 力 以 持续 确保 满意 的 时 延 和 丢 包 性 能 
| Huang 2005 | 。 我 们 将 在 7.5.1 节 中 进一步 讨论 网 络 定制 (network dimensioning ) 。 

e 区 分 服务 。 自 因特网 的 早期 ， 就 已 经 设想 不 同类 型 的 流量 (例如 ， 在 IPv4 分 组 首 
部 中 服务 类 型 字段 所 指示 的 类 型 ) 能 够 由 不 同类 型 的 服务 所 提供 ， 而 不 是 单一 的 
“以 不 变 应 万 变 ” 的 尽力 而 为 服务 .使 用 区 分 服务 ， 当 两 类 流量 在 一 台 路 由 疮 中 排 
队 时 ， 一 种 类 型 的 流量 可 以 给 定 严格 的 优 于 另 一 种 类 型 的 流量 的 优先 权 。 例 如 ， 
属于 实时 会 话 式 应 用 的 分 组 由 于 其 严格 的 时 延 限 制 ， 可 能 会 给 定 优 于 其 他 分 组 的 
优先 权 。 在 网 络 中 引入 区 分 服务 将 要 求 一 些 用 于 分 组 标记 (指示 一 个 分 组 的 服务 
类 型 ) 、 分 组 调度 和 其 他 方面 的 新 机 制 。 我 们 将 在 7.5.2 市 中 涉及 区 分 服务 以 及 实 
现 这 种 服务 的 新 网 络 机 人 制 。 

e 每 连接 服务 质量 (QoS) 保证 。 使 用 每 连接 QoS 保证 ， 每 个 应 用 的 实例 显 式 地 预 
约 端 到 端 带宽 ， 并 因此 具有 确保 的 端 到 端 性 能 。 硬 保证 (hard guarantee) 意味 看 
应 用 将 必定 接收 到 它 所 请 求 的 服务 质量 。 软 保证 (soft guarantee) 意味 看 应 用 将 以 
高 概率 接收 到 它 所 请 求 的 服务 质量 。 例 如 ， 如 果 某 用 户 要 从 主机 A 向 主机 B 进行 
VoIP 呼叫 ， 该 用 户 的 VoIP 应 用 在 两 台 主 机 之 间 治 着 路 径 在 每 条 链 路 上 显 式 地 预 贸 
带宽 。 但 是 ， 人 允许 应 用 做 预约 和 请 求 网 络 同意 该 预约 ， 这 需要 一 些 大 的 变化 。 首 
先 ， 我 们 需要 一 个 协议 来 代表 应 用 程序 ， 从 发 送 方 到 其 接收 方 沿路 径 预 约 链 路 市 
宽 。 第 二 ， 在 路 由 器 队列 中 将 需要 新 的 调度 策略 ， 使 每 连接 审 宽 预约 能 够 名 现 。 
最 后 ， 为 了 进行 预约 ， 应 用 程序 必须 问 网 络 给 出 描述 来 说 明 它们 希望 发 送 进 网 络 
的 流量 ， 并 且 网 络 将 需要 监管 每 个 应 用 程序 的 流量 以 确保 它 遵守 这 个 描述 。 当 这 
些 机 制 结合 时 ， 在 主机 和 路 由 融 中 要 求 新 的 和 复杂 的 软件 。 因 为 每 连接 QoS 保证 
服务 尚未 见 到 大 规模 部 署 ， 我 们 将 仅 在 7.5.3 节 中 简要 地 涉及 这 些 机 制 。 


7.5.1 定制 尽力 而 为 网 络 


从 根本 上 说 ， 支 持 多 媒体 应 用 的 困难 是 由 其 严格 的 性 能 要 求 引 起 的 ， 即 低 的 疹 到 病 分 
组 时 延 、 时 延 拌 动 和 丢 包 ， 而 事实 是 ， 无 论 何 时 网 络 变 得 拥塞 ， 都 将 出 现 较 大 的 分 组 时 
延 、 时 延 抖 动 和 丢 包 。 改 善 多 媒体 应 用 质量 的 第 一 种 方法 就 是 “在 问题 上 胡 钱 ”， 因 此 有 
接 避 免 资源 竞 争 即 可 。 这 种 方法 常用 于 解决 有 关 资 源 受 限 的 任何 问题 。 在 网 络 多 媒体 的 场 
合 ， 这 意味 着 在 整个 网 络 中 提供 充足 的 链 路 带宽 ， 使 网 络 拥 塞 及 其 导致 的 分 组 时 延 和 丢失 
决 不 会 (或 仅 非 常 少 地 ) 出 现 。 具 有 充足 的 链 路 带宽 ， 分 组 将 很 快 地 通过 今天 的 因特网 而 
没有 排队 时 延 或 丢失 。 从 许多 方面 看 ， 这 是 一 种 理想 的 情况 : 完美 地 执行 多 媒体 应 用 ， 用 
户 是 幸运 的 ， 所 有 要 求 都 能 够 满足 而 不 改变 因特网 尽力 而 为 的 体系 结构 。 

当然 ， 问 题 是 为 实现 这 种 极乐 世界 提供 多 大 容量 才 是 “充足 的 "， 以 及 提供 “充足 
的 ”带宽 的 成 本 从 ISP 的 商业 角度 来 说 是 否 实际 。 在 一 个 给 定 拓扑 中 为 网 络 链 路 提供 多 大 
容量 以 取得 给 定 水 平 的 性 能 的 问题 常 被 称 为 带宽 供给 (bandwidth provisioning)。 如 何 设 计 
一 个 网 络 拓扑 〈 其 中 放置 一 些 路 由 需 ， 如 何 用 链 路 互联 这 些 路 由 希 ， 并 为 链 路 分 配 容量 ) 以 
取得 给 定 水 平 的 端 到 端 性 能 这 个 更 为 复杂 的 问题 党 被 称 为 网 络 定 制 (network dimensioning) 。 
带宽 供给 和 网 络 定 制 都 是 复杂 的 专题 ， 它 们 远 超 过 了 本 教科 书 的 范围 。 然 而 ， 我 们 这 里 注 
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量 来 满足 应 用 的 性 能 要 求 。 
© 网 络 端点 之 间 的 流量 要 求 模型 ”这 些 模 井 可能 需要 定义 在 呼叫 层次 (例如 ， 用 户 
“到 达 ” 网 络 并 启动 端 到 端 应 用 ) 和 分 组 层次 (例如 ， 由 进行 中 的 应 用 所 产生 的 
分 组 ) . 注意 负载 可 能 随 着 时 间 而 变化 
e 定义 良好 的 性 能 要 求 。 例如 ， 为 文 持 诸如 会 话 式 多 媒体 应 用 等 时 延 敏 感 的 流量 ， 
其 性 能 要 求 可 能 是 : 分 组 的 端 到 端 时 延 大 于 最 大 可 容 狼 时 延 的 概率 要 小 于 某 个 很 
小 的 什 | Fraleigh 2003 | 。 
e 对 给 定 的 负载 模型 预测 端 到 端 性 能 的 模型 ， 以 及 求 出 最 小 成 本 带宽 分 配 (该 带宽 
分 配 将 导致 满足 所 有 用 户 的 需求 ) 的 技术 。 这里， 研究 人 员 正 忙于 研发 能 够 量化 
给 定 负 载 下 的 性 能 的 性 能 模型 ， 以 及 能 求 出 满足 性 能 要 求 的 最 小 成 本 市 宽 分 配 的 
优化 技术 ， 
假定 今天 尽力 而 为 的 因特网 能 够 ( 从 技术 角度 讲 ) 以 适当 的 性 能 水 平 文 持 多 媒体 流量 
( 如果 它 被 定制 成 这 样 的 话 ) ， 自 然 的 问题 是 为 什么 今天 的 因特网 满足 不 了 了 这样 的 要 求 。 众 
案 基 本 上 是 经 济 上 和 组 织 上 的 原因 。 从 经 济 和 角度 看 ， 用 户 将 愿意 向 其 ISP 支付 足够 多 的 费 
HH, (E ISP 安村 充足 的 寓 宽 经 尽力 而 为 的 因特网 来 文 持 多 媒体 应 用 吗 ? 组 织 问题 也 评 更 为 
SATIR. 注意 到 在 两 个 多 媒体 端点 之 间 的 端 到 端 路 和 从 将 通过 多 个 ISP 的 网 络 。 从 组 织 角 
度 看 ， 这 些 ISP 将 愿意 合作 (也许 以 收入 共 至 方式 ) 以 确保 闪 到 端 路 径 被 适当 地 定制 来 文 
持 多 媒体 应 用 吗 ?” 对 这 些 经 济 和 组 织 问 题 的 展望 ， 参 见 | Davies 2005 | ， 对 于 供给 第 一 层 


主 十 网 络 以 文 持 时 延 敏 感 流 量 的 展望 ， 参 见 | Fraleigh 2003 | 
7.5.2 提供 多 种 类 型 的 服务 


也 许 对 今天 因特网 中 的 以 不 变 应 万 变 的 尽力 而 为 服务 而 言 ， 一 种 最 简单 的 强化 是 将 流 
量 划 分 为 多 种 类 型 ， 并 为 这 些 不 同类 型 的 流量 提供 不 同等 级 的 服务 。 例如. HE ISP 可 能 要 
为 时 延 敏 感 的 VoIP 或 电信 会 议 流量 比 为 电子 邮件 或 HTTP 等 弹性 流量 提供 更 高 的 服务 类 
型 (并 对 该 服务 收取 更 高 的 费用 !) 。 另 一 种 做 法 是 ，LSP 可 能 直接 向 愿意 对 这 种 改进 服务 
文 付 更 多 费用 的 顾客 提供 更 高 质量 的 服务 。 一些 住宅 有 线 接 人 ISP ARE Be CZK GR A ISP 已 
经 采用 了 这 样 的 梯次 等 级 服务 ， 即 铂金 卡 服 务 用 户 比 金 卡 服务 用 户 或 银 卡 服务 用 户 享有 更 
好 的 服务 性 能 。 

我 们 都 从 日 贡生 活 中 熟悉 了 不 同类 型 的 服务 ， 如 航班 上 头等 舱 乘 客 比 公务 舱 乘 客 得 到 
更 好 的 服务 ， 公 务 舱 乘客 又 比 经 济 舱 乘客 得 到 更 好 的 服务 ; VIP 在 活动 中 能 够 立即 进入 ， 
而 所 有 其 他 人 都 必须 排队 等 待 ; 在 某 些 国家 中 老年 人 被 对 重 ， 提供 了 荣誉 座位 和 最 精细 的 
食物 。 重 要 的 是 注意 到 在 聚合 流量 中 ( 即 在 多 种 流量 类 型 中 而 不 是 单个 连接 中 ) 提供 了 这 
种 有 差别 的 服务 . 例如 ， 所 有 头等 舱 乘 客 被 一 视 同 仁 〈( 没 有 哪个 头等 舱 乘 客 得 到 了 比 其 他 
头等 舱 乘 客 更 好 的 服务 ) ， 就 像 所 有 的 VoIP 分 组 在 网 络 中 得 到 了 相同 的 对 待 ， 与 它们 所 属 
的 特定 的 闪 到 端 连接 无 关 。 如 我 们 将 见 到 的 那样 ， 通 过 处 理 少 量 的 流量 聚合 ， 而 不 是 大 量 
的 单个 连接 ， 提 供 好 于 尽力 而 为 服务 所 需要 的 新 型 网 络 机 制 能 够 你 持 相 对 简单 。 

早期 因特网 设计 者 的 心中 清晰 地 具有 这 种 多 种 类 型 服务 的 概念 。 回 想 在 图 4- 13 中 
IPv4 站 部 中 的 服务 类 型 (ToS) 字段 。IEN123 [ISI 1979] 描述 也 呈现 在 [Pv4 数据 报 的 原 
型 中 的 ToS 字段 时 说 :“ 服 务 类 型 | 字段] 提供 了 所 希望 的 服务 质量 的 抽象 参数 的 指示 
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当 传 输 一 个 数据 报 通过 某 特 定 网 络 时 ， 这 些 参数 被 用 于 引导 实际 服务 参数 的 选择 。 几 种 网 
络 提供 了 服务 优先 权 ， 该 优先 权 以 某 种 方式 把 高 优先 权 流 量 看 得 比 其 他 流量 更 为 重要 。 
在 40 多 年 前 ， 回 不 同等 级 的 流量 提供 不 同等 级 的 服务 的 设想 就 是 清晰 的 ! 然而 ， 我 们 又 
化 费 了 等 长 的 时 间 去 实现 这 种 愿景 。 

1. 激励 思考 的 场景 

下 面 用 几 种 激励 思考 的 场景 来 开始 我 
们 的 提供 多 种 类 型 服务 的 网 络 机 制 的 讨论 。 

图 7-14 表示 了 一 种 简单 的 网 络 场景 ， 
两 个 应 用 分 组 流产 生 于 位 于 一 个 局 域 网 的 
主机 Hl 和 H2， 它 们 的 目的 地 是 男 一 个 局 
域 网 的 主机 H3 和 H4。 在 这 两 个 局 域 网 上 
的 两 台 路 由 带 通 过 一 条 1. 5Mbps 的 链 路 连 
接 起 来 。 我 们 假设 局 域 网 的 速度 远 远 高 于 
1. 5Mbps, Jt H X iÈ Ek i áf R1 的 输出 队 
列 ; 注意 到 如 果 HI 和 H2 的 总 计 发 送 速 
率 超 过 了 1. 5Mbps， 分 组 时 延 和 于 包 将 会 
HE., 我们 进一步 假设 1Mbps 的 音频 应 用 (例如 一 个 CD 质量 的 音频 呼叫 ) 共享 R1 和 
R2 之 间 1. 5Mbps 的 链 路 ， 同 时 从 H2 到 H4 有 一 个 HTTP Web 浏览 应 用 正在 下 载 一 个 
Web R] W. 

在 尽力 而 为 服务 的 因特网 中 ， 该 音频 和 HTTP 分 组 在 R 的 输出 队列 中 混合 ， 并 且 
Cis) 以 先进 先 出 (FIFO) 的 次 序 传输 。 在 这 种 情况 下 ,来 自 Web 服务 需 的 突 发 分 组 可 
能 淤 在 地 填充 满 这 个 队列 ， 引 起 IP 音频 分 组 过 度 延 迟 或 者 由 于 RI 的 缓存 洲 出 而 丢失 。 我 
们 应 该 如 何 解 决 这 个 潜在 的 问题 呢 ?” 假 定 该 HTTP Web 浏览 应 用 没有 时 间 限 制 ， 我 们 的 直 
觉 也 许 是 在 R 为 音频 分 组 分 配 严 格 的 优先 级 。 在 一 个 严格 的 优先 级 调度 规则 下 ， 在 RI 
输出 缓存 的 音频 分 组 总 是 在 RI 输出 缓存 中 的 任何 HTTP 分 组 之 前 传输 。 对 音频 流量 而 言 ， 
从 R1 到 R2 的 链 路 看 起 来 像 一 条 1. SMbps 专用 链 路 ， 而 对 于 HTTP 流量 仅 当 没有 音频 流量 
排队 时 ， 才 使 用 RI 到 R2 的 链 路 。 为 了 让 RI 在 它 的 队列 中 区 分 音频 和 FTP 分 组 , ,每 个 分 
组 必须 被 标记 为 属于 这 两 类 流量 中 的 哪 一 类 。 这 是 IPv4 中 服务 类 型 (ToS) 字段 的 最 初 目 
的 。 显 而 易 见 ， 这 则 是 我 们 对 需要 提供 多 种 类 型 流量 机 制 的 第 1 个 见解 。 

见解 1: 标记 分 组 (packet marking) 使 得 路 由 器 区 分 属于 不 同类 型 流量 的 分 组 。 

注意 到 尽管 我 们 的 例子 考虑 到 苋 争 性 的 多 媒体 和 弹性 流 ， 但 是 相同 的 见解 应 用 于 实现 
了 铂金 卡 、 金 卡 和 银 卡 服务 类 型 的 情况 ， 即 仍 需要 标记 分 组 机 制 以 指示 分 组 属于 哪个 类 型 
的 服务 。 

现在 假设 路 由 器 被 配置 为 给 标记 为 属于 1Mbps 音频 应 用 的 分 组 赋予 高 优先 级 。 因 为 输 
出 链 路 速度 是 1.5Mbps， 即 使 HTTP 分 组 得 到 较 低 的 优先 级 ， 它 们 仍然 可 以 收 到 平均 
0. 5Mbps 的 传输 服务 。 但 是 如 果 音 频 应 用 开始 以 1. 5Mbps 或 者 更 高 的 速率 (或 者 恶意 的 ， 
或 者 由 于 应 用 的 差错 ) 发 送 分 组 ， 那 会 出 现 什 么 样 的 情况 呢 ? 在 这 种 情况 下 ，HTTP 分 组 
KERR, theta fe RI 到 R2 的 链 路 上 得 不 到 任何 服务 。 如 果 多 个 应 用 (例如 ， 多 个 音频 
呼叫 ) 都 上 有 具有 同 每 的 服务 类 型 ， 共 享 一 段 链 路 带宽 ， 那 么 也 会 出 现 类 似 问题 ， 即 它们 也 可 
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图 7-14 音频 应 用 与 FTP 应 用 的 竞争 
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中 ， 在 进入 网 络 的 首 个 入口 ， 或 在 网 络 边界 域 间 。 这 则 是 我 们 的 第 2 个 见解 。 


Fiii 希望 在 流量 类 型 之 间 提 供 流量 隔离 (traffic isolation) 的 度 ， 以 便 一 类 流量 不 

受到 另 一 类 并 第 流量 的 负面 影响 

我 们 将 考察 在 流量 类 型 之 加 提供 这 种 陋 
离 的 特定 机 制 。 这 里 我 们 注意 到 ， 有 两 大 类 
方法 可 以 使 用 。 首先， 可 以 执行 如 图 7-15 
所 示 的 流量 监管 (traffiec policing) 方法 。 如 
KIER 型 或 流 必 须 满足 一 定 的 准则 ( 例 
如 ， 音 频 流 不 超过 1Mbps 的 峰值 速率 ) ， 那 
么 可 以 设置 一 个 监管 机 制 来 确 你 这 些 准 则 的 
确 被 遵守 。 如 果 被 监管 的 应 用 行为 异 兽 ， 这 
个 监管 机 DE REGER TH (PO, EF 
或 者 延 时 那些 违反 这 些 ni 则 的 分 组 ) ， 以 
实 未 进入 网 络 的 流量 名 这 些 准则 我 们 和 
快 将 考察 的 漏 棚 机 制 也 许 是 使 用 最 广泛 的 hs 
管 机 制 。 在 * 7-15 中 ,分 组 分 类 和 标记 机 
制 (见解 1) 以 及 监管 机 制 (见解 2) 都 一 
起 在 epee ， 或 在 关系 统 中 实现 ， 
或 在 边界 路 由 得， PII. 

为 流量 类 型 之 间 提 供 隔离 的 一 种 互补 的 ”图 7-15 监管 (与 标记 ) 音频 与 HTTP 流量 类 型 
方法 是 ， 链 路 级 的 分 组 调度 机 制 为 每 种 类 型 ” n 
明确 地 分 配 固 定量 的 链 路 带宽 。 例 如 ， ~ \ N 
RI 能 够 给 音频 类 型 分 配 1Mbps， 能 够 给 H 
TP 流 分 配 0. 5Mbps, 在 这 种 情况 下 ， alan 
HT TP 流 分 别 看 到 了 容量 为 1.0Mbps 和 


\ 
| 分 组 标记 和 监管 






R2 


1.5Mbps 链 
ps 链 路 > 一 
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(+) 测定 和 监管 || biie 
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0. SMbps 的 逻辑 链 路 ， 如 图 7-16 所 示 。 通 ic 
过 严格 执行 链 路 级 的 带宽 分 配 ， 一 种 类 型 仅 0. Mbpsi i i 





能 够 使 用 已 经 分 配 的 带宽 量 ; 特别 是 ， 它 不 
能 利用 其 他 应 用 现在 未 使 用 的 带宽 ， 例如 ， 
如 条 音频 流 静 默 了 (例如 ， 如 果 谈 话 者 停 
顿 ， 不 产生 音频 分 组 ) HTTP 流 在 RI 到 
R2 的 链 路 上 的 传输 带宽 仍然 不 能 够 超过 图 7-16 音频 与 HTTP 流量 类 型 的 逻辑 陋 离 
0. 5Mbps ， 即 使 音频 流 分 配 的 1Mbps 带 sill il 没有 使 用 。 由 于 市 宽 是 一 种 “使 用 它 
WERKE (use-it-or-lose-it)” 的 资源 ， 没 有 理由 妨碍 HTTP 流量 使 月 ] 没 有 由 音 a 
ae Ue c PAVE ETT NERS RA I, 当 能 够 以 别 的 方法 使 用 它 时 决 不 浪费 市 党 。 这 
引发 我 们 的 第 3 个 见解 。 

见解 3: 当 为 流量 类 型 或 流 之 间 提 供 隔离 时 ， 和 希望 尽 可 能 有 效 地 使 用 资源 (例如 链 路 
带宽 和 缓存 )， 
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2. 调度 机 制 

在 1.3 三 和 4.3 市 我 们 曾经 讨论 过 ， 属 于 各 种 网 络 流 的 分 组 被 复 用 在 一 起 ， 并 且 在 与 
链 踏 关联 的 辆 出 绥 存 排队 等 入 传输 。 选择 在 链 踏 上 传输 的 排队 分 组 的 方式 称 为 链 路 调度 规 
则 (link-scheduling discipline) 我们 现在 更 详细 地 考虑 几 个 最 量 要 的 链 路 调度 规则 < 

(1) 先进 先 出 

多 7-17 显示 了 对 于 先进 先 出 ( First- 
In-First-Out, FIFO) 链 路 调度 规则 的 排队 
ERIR UR HEER TEE FEA 
-个 分 组 ， 到 达 链 路 输出 队 亿 的 分 组 要 排 
队 等 竺 传输， 如 果 没 有 足够 的 缓存 空间 来 
容纳 到 达 的 分 组 ， 队 列 的 分 组 丢弃 策略 
( packet- discarding policy) 则 确定 该 分 组 是 
PPA ES FR CER) 或 者 其 他 分 组 将 从 队 
列 中 去 除 以 为 到 达 的 分 组 膳 出 空间 。 a 
面 的 讨论 中 .我 们 将 忽视 分 组 丢 莽 ， 

个 分 组 通过 输出 链 路 完全 传输 (也 就 是 
收服 务 ) 时 ， 它 从 队列 中 去 除 。 图 7-17 FIFO 排队 抽象 

FIFO (WERNERI, EI FCFS) 

Ja RE KRL FÈ BE DEH EIA fi ih BEA BA DI ASAH EARE REFE HE ER E tmo FRAT AB AAR 
公共 汽车 站 (尤其 在 英格兰 ,那里 的 排队 看 起 来 已 经 很 完善 了 ) 或 者 其 他 服务 中 心 的 
FIFO 排队 .在 那里 到 达 的 原 客 加 入 单一 等 待 队 列 的 最 后 ， 保 持 次 序 ， 然 后 当 他 们 到 达 队 
伍 的 前 面 时 束 接 受 | ik 务 。 

图 7-18 显示 了 运行 中 的 FIFO 队列 。 分 组 的 到 达 由 上 部 时 间 线 上 带 编 号 的 箭头 来 指 
不， 该 编写 指 示 了 分 组 到 达 大 的 次 序 。 各 个 分 组 的 离开 表示 在 下 部 时 间 线 的 下 面 。 分 组 在 服 
务 中 (被 传输 ) 化 费 的 时 间 是 通过 这 两 个 时 间 线 之 间 的 阴影 矩形 来 指示 的 。 由 于 FIFO 规 
则 ， 分 组 按照 到 达 的 相同 次 序 离开 。 注意 在 分 组 4 离开 之 后 ， 在 分 组 5 到 达 之 前 链 路 保持 
FA 〈( 央 为 分 组 1~4 已 经 被 传输 并 从 队列 中 去 除 ) 











on || | | 
! 时 间 
服务 中 
的 分 组 
i=0 =2 i=4 t36 t=8 {=10 12 t=14 oH 
ai | | | | | 


图 7-18 操作 中 的 FIFO 队列 


(2) 优先 级 排队 

使 用 优先 级 排队 (prionity queuing) 规划， 到 达 输 出 链 路 的 分 组 被 分 类 放 入 输出 队列 
中 的 优先 级 类 ， 如 图 7-19 所 示 。 如 前 一 节 所 讨论 ， 一 个 分 组 的 优先 级 类 可 能 取决 于 其 分 
组 首部 携 审 的 一 个 明显 的 标记 《例如 ， 在 一 个 IPv4 分 组 中 ToS 比特 的 值 ) 、 它 的 源 或 者 目 








As. EAS Aye ok A HABERE. BEC MA ACR APA AAAS, “FE 
分 组 传输 时 ， 优 先 级 排队 规则 将 从 队列 为 非 空 〈 也 就 是 有 分 组 等 待 传输 ) 的 最 高 优先 级 类 
中 传输 一 个 分 组 。 在 同一 优先 级 类 的 分 组 之 间 的 选择 通常 以 FIFO 方式 完成 


高 优先 级 队列 
(等 待 区 ) 





pe | 
到 达 | \ 离开 
: ~ J 一 一 > 
i 低 优先 级 队列 ) 
( 等待 区 ) 


图 7-19 优先 级 排队 模型 


图 7-20 描述 了 有 两 个 优先 级 类 的 一 个 优先 级 队列 的 操作 。， 分 组 1、3 和 4 属于 高 优先 
级 类 ， 分 组 2 和 5 属于 低 优先 级 类 . 到 达 并 发 现 链 路 是 空 亲 的， 就 开始 传输 ， 在 分 
组 1 的 传输 过 程 中 ， 分 组 2 和 3 到 达 ， 并 分 别 在 低 优先 级 和 高 优先 级 队列 中 排队 。 在 传输 
元 分 组 1 后 ， 分 组 3 (一 个 高 优先 级 的 分 组 ) 被 选择 在 分 组 2 (尽管 它 到 达 得 较 早 ， 但 它 
是 一 个 低 优先 级 分 组 ) 之 前 传输 。 在 分 组 3 的 传输 结束 后 ， 分 组 2 开始 传输 ， 分 组 4 (一 
个 高 优先 级 分 组 ) g (一 个 低 优先 级 分 组 ) 的 传输 过 程 中 到 达 。 在 所 谓 的 非 抢 占 式 
优先 级 排队 规则 下 ， 一 旦 分 组 开始 传输 ， 传输 就 不 能 打 断 。 在 这 种 情况 下 ， 分 组 4 排队 等 
竺 传输 ， 并 在 分 组 2 传 完成 之 后 开始 传输 。 





F2 pr 
A ee) S O 
的 分 组 mz pE 
| 1 l | | 


离开 (7 eT 
图 7-20 (EER BA SI AY BEE 


(3) 循环 和 加 权 公 平 排队 

使 用 循环 排队 规则 (round robin queuing discipline) ， 分 组 像 使 用 优先 级 排队 一 样 被 分 
K. 然而 ， 在 类 之 间 不 存在 严格 的 服务 优先 级 ， 循 环 调度 需 在 这 些 类 之 间 轮 流 提 供 服务 
在 最 和 何 单 形式 的 循环 调度 中 ， 类 1 的 分 组 被 传输 ， 接 着 是 类 2 的 分 组 ， 接 兰 又 是 类 1 的 分 
组 ， 骨 接着 又 是 类 2 的 分 组 等 等 。 一 个 所 谓 的 保持 工作 的 排队 规则 ， 即 在 有 (任何 类 的 ) 
分 组 排队 等 待 传输 时 不 允许 链 路 保持 空 亲 。， 当 寻找 给 定 类 的 分 组 但 是 没有 找到 时 ， 保 持 工 
作 的 循环 规则 (work-conserving round robin discipline) 将 立即 检查 循环 序列 中 的 下 一 个 类 

图 7-21 摘 述 了 一 个 两 类 循环 队列 的 操作 。 在 这 个 例子 中 ， 分 组 1、2 和 4 属 rt 
分 组 3 和 5 属于 第 二 类 。 分 组 1 一 到 达 输 出 队列 就 立即 开始 传输 。 分 组 2 和 3 在 分 组 1 的 
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传输 过 程 中 到 达 ， 因 此 排队 等 行 传输 。 在 分 组 1 传 箱 后 ， 链 路 调度 需 寻 找 类 2 的 分 组 ， 内 
此 传输 分 组 3。 在 分 组 3 传输 完成 后 ， 调 度 角 寻找 类 1 的 分 组 ， 因 此 传输 分 组 2。 在 分 组 2 
传输 完成 后 ， 分 组 4 是 唯一 的 排队 的 分 组 ， 因 此 在 分 组 2 后 立刻 传输 分 组 4。 

An 


Fs 
jj 达 
i [Lil Se 一 网 


服务 中 
的 分 组 En 3 Er rs 
和 一 一 EE Oe EE See ERE 
1=0 2 | 4 (5 ay; 20 eo ea 4 
离开 | | | 


「 3 z3 
图 7-21 两 类 循环 队列 的 操作 


在 QoS 体系 结构 中 已 经 得 到 大 量 使 用 的 循环 排队 的 一 个 通用 抽象 就 是 所 谓 的 加 权 公 平 
排队 (Weighted Fair Queuing, WFQ) 规则 | Demers 1990; Parekh 1993 | [X] 7-22 对 WFQ 
进行 了 摘 述 . 到达 的 分 组 被 分 类 并 在 合适 的 每 个 类 的 等 待 区 域 排队 。 与 使 用 循环 调度 一 
FE, WFQ 调度 上 融 也 以 循环 的 方式 为 各 个 类 提供 服务 ， 即 首先 服务 第 1 类 ， 然 后 服务 第 2 
K, RERI P3 类 ， 然 后 (假设 有 3 个 类 别 ) 重复 这 种 服务 模式 。WFQ 也 是 一 个 保 
持 工 作 的 排队 规则 ， 因 此 在 发 现 一 个 空 的 类 队列 时 ， 它 立即 移 回 服务 序列 中 的 下 一 个 类 。 

WFO 和 循环 排队 不 同 之 处 在 于 ， 每 个 类 在 任何 时 间 间 隅 内 可 能 收 到 和 不同 数量 的 服务 ， 
具体 而 言 ， 每 个 类 i 被 分 配 一 个 权 w。 使 用 WFQ 方式 ， 在 类 上 有 分 组 要 发 送 的 任何 时 间 间 陋 
中 ， 第 i 类 将 确保 接收 到 的 服务 部 分 等 于 wA( Zw )， 式 中 分 母 中 的 和 是 计算 所 有 有 分 组 排 
队 等 符 传 输 的 类 别 得 到 的 。 在 最 坏 的 情况 下 ， 即 使 所 有 的 类 都 有 分 组 排队 ， 第 :类 仍然 保证 
分 配 到 市 宽 的 w, Ew) 部 分 。 这 样 ， 对 于 一 条 传输 速率 为 RR 的 链 路 ， 第 i 类 总 能 获得 至 少 
为 RwA( Zw) 的 在 吐 量 。 我 们 对 WFQ 的 描述 理想 化 了 ， 因 为 我 们 没有 考虑 这 样 的 事实 : 
分 组 是 离散 的 数据 单元 ， 并 且 不 能 打 断 一 个 分 组 的 传输 来 开始 传输 另 一 个 分 组 ; | Demers 
1990] 和 | Parekh 1993] 讨论 了 这 个 分 组 化 问题 。 如 我 们 将 在 下 面 几 节 所 见 ，WFQ 在 QoS 
体系 结构 中 起 了 重要 的 作用 : 现在 的 路 由 大 产品 中 也 用 到 了 WFO | Cisco QoS 2012]. 


p—e 


ae Fe 





图 7-22 加权 公平 排队 


3. 监管 : WAI 
我 们 前 面 的 见解 之 一 是 监管 ， 速 率 的 调节 是 一 种 重要 的 QoS 机 制 ， 以 该 速率 允许 一 类 
流量 或 流 〈 在 下 面 的 讨论 中 ， 我 们 将 假定 监管 的 单位 是 流 ) 回 网 络 注入 分 组 。 但 是 应 该 对 
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一 个 流 的 分 组 速率 的 哪些 方面 进行 监管 呢 ? 我 们 能 够 指出 3 个 重要 的 监管 准则 ， 每 个 准则 
根据 被 监管 分 组 流 的 时 间 范 围 而 互 不 相同 : 

© 平均 速率 。 网 络 可 能 希望 限制 一 个 流 的 分 组 能 够 发 送 到 网 络 中 的 长 期 平均 速率 

(每 个 时 间 间 隔 的 分 组 数 )。 这 里 一 个 关键 的 问题 是 监管 平均 速率 的 时 间 间 隔 。 一 
个 平均 速率 被 限制 为 每 秒 100 个 分 组 的 流 要 比 一 个 每 分 钟 6000 个 分 组 的 源 受 到 的 
约束 更 严格 ， 即 使 在 一 个 足够 长 的 时 间 间 隐 上 它们 有 相同 的 平均 速率 。 例如， 后 
者 的 限制 允许 一 个 流 在 给 定 1 秒 钟 长 的 时 间 间 隔 内 发 送 1000 个 分 组 ， 而 前 者 的 限 
制 不 允许 这 种 发 送行 为 。 

o 峰值 速率 。 平均 速率 约束 限制 了 一 个 相对 长 的 时 间 内 能 够 发 送 到 网 络 中 的 流量 ， 
而 峰值 约束 限制 了 一 个 较 短 时 间 内 能 够 发 送 的 最 大 分 组 数 。 使 用 我 们 上 面 的 例子 ， 
网 络 能 以 每 分 钟 6000 个 分 组 的 平均 速率 来 监管 一 个 流 ， 但 是 限制 该 流 的 峰值 速率 
为 每 秒 1500 个 分 组 。 

o FAKE. 网络 也 许 还 希望 限制 极 短 的 时 间 间 隔 内 能 够 发 送 到 网 络 中 的 最 大 分 组 
数 (分 组 的 “ 突 发 (burst)”)。 在 这 个 限制 中 ， 因 为 时 间 间 隔 长 度 趋 近 于 0， 该 突 
发 长 度 限 制 了 7 能够 瞬间 发 送 到 网 络 中 的 分 组 数量 。 尺 管 瞬间 发 送 多 个 分 组 到 网 络 
中 在 物理 上 是 不 可 能 的 (毕竟 每 条 链 路 都 有 一 个 无 法 超越 的 物理 传输 速率 !) ， 但 
对 最 大 突 发 长 度 的 抽象 也 是 有 用 的 。 

漏 棚 机 制 是 一 个 能 够 用 来 表征 这 些 监管 限制 的 抽象 。 如 图 7-23 所 示 ， 漏 桶 由 一 个 能 
够 容纳 5 个 令 牌 的 桶 组 成 。 令 牌 加 进 该 桶 的 过 程 如 下 。 可 能 潜在 地 加 入 桶 中 的 新 令 牌 总 是 
以 每 秒 r 个 令 牌 的 速率 产生 。( 为 了 简单 化 起 见 ， 我 们 这 里 假设 时 间 单 元 是 秒 .) 当 产 生 一 
个 令 牌 时 ， 如 果 桶 填充 得 少 于 上 个 令 牌 ， 新 产生 的 令 牌 加 入 到 该 桶 中 ;否则 忽略 该 新 产生 





的 令 牌 ， 令 有 牌 桶 保持 具有 6b 个 令 牌 的 满 状 态 。 
<> 


r 个 令 牌 / 秒 





图 7-23 dha ni at 


现在 我 们 考虑 如 何 用 漏 桶 来 监管 分 组 流 。 假 设 在 一 个 分 组 向 网 络 传输 之 前 ， 必 须 首 先 
从 令 牌 桶 中 去 除 一 个 令 牌 。 如 果 令 牌 桶 是 空 的， 分 组 必须 等 待 一 个 令 牌 。( 为 一 种 方法 是 
丢弃 该 分 组 ， 尽 管 我 们 这 里 不 讨论 这 种 选择 。) 现在 我 们 考虑 这 种 行为 是 如 何 监管 一 个 流 
量 流 的 。 因 为 在 桶 中 最 多 能 有 6b 个 令 牌 ， 所 以 漏 桶 监管 的 流 的 最 大 突 发 长 度 是 4 个 分 组 。 
此 外 ， 因 为 令 牌 产生 速率 是 r， 所 以 在 任何 长 度 为 1 的 时 间 间 隔 内 能 够 进入 网 络 中 的 最 大 
分 组 数目 为 rt +5。 因此 ， 令 牌 产生 速率 r 用 于 限制 分 组 能 够 进入 网 络 的 长 期 平均 速率 。 除 
了 监管 长 期 平均 速率 之 外 ,使 用 漏 桶 (具体 来 说 ， 串 联 的 两 个 漏 桶 ) 来 监管 流 的 峰值 速率 
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也 是 有 可 能 的 ; 见 本 草 末 的 习题 。 

hia FH + 加权 公平 排队 = 队列 中 可 证 明 的 最 大 时 延 

通过 显示 如 何 将 调度 和 监管 两 种 机 制 结合 起 来 ， 以 提供 通过 路 由 名 队列 的 时 延 界 限 ， 
我 们 结束 了 相关 讨论 。 我 们 考虑 一 台 使 用 了 WFQ 调度 的 路 由 费 ， 它 的 输出 链 路 多 路 复 用 
了 条 流 ， 其 中 每 条 流 被 一 个 参数 为 上 和 7 的 漏 桶 监管 ,i =1，…,n， 这 里 我 们 使 用 的 
术语 “ 流 ” 大 致 是 指 不 能 被 调度 需 相 互 区 别 的 分 组 集合 。 实 践 中 ， 一 条 流 可 能 是 由 单个 端 
到 冰 连 接 上 的 流量 或 者 许多 这 种 连接 的 集合 流量 组 成 的 ， 人 参见 图 7-24。 





图 7-24 RH WFO 调度 机 制 的 n 路 复 用 的 源 桶 流 


我 们 前 面 讨论 WFO 时 讲 过 ， 每 个 流 工 保证 收 到 至 少 等 于 及 w Ew) AHE E ee ay 
克 ， 其 中 民 是 以 分 组 / 秒 为 单位 的 链 路 传输 速率 。 当 以 WFQ 方式 等 行 服务 时 (也 就 是 遂 过 汤 
桶 传递 之 后 )， 则 分 组 经 受 的 最 大 时 延 是 什么 ”我 们 来 大 注 流 1 假设 流 1 EAK 
的 。 然 后 包 个 分 组 的 突 发 到 达 流 1 的 源 桶 监管 生 ， 这 些 分 组 去 除了 源 桶 中 所 有 的 令 牌 (没有 
tt). SAMA Tit 1 的 WFQ FFK, A AX b, 个 分 组 以 至 少 R w/( Zw) 分 组 / 秒 
的 速度 得 到 服务 ， 直 到 这 些 分 组 的 最 后 一 个 传输 完成 ， 所 以 将 有 最 大 时 延 d,,,, ， 其 中 


TN 





这 个 公式 的 基本 原理 是 ， 如 果 在 队列 中 有 b, 个 分 组 并 且 分 组 以 至 少 每 秒 R :ww/( Lu) 
个 分 组 的 速率 从 队列 中 接受 服务 (被 去 除 ) ， 那 么 直到 最 后 一 个 分 组 的 最 后 一 个 比特 被 传送 ， 
时 间 量 不 会 超过 乌 /(R ,wz( Zw ) ) 。 一 道 课 后 习题 请 你 证 明 ， 只 要 mm < R w/l Ew), W 
4 确实 是 流 1 中 任何 分 组 在 WFQ 队列 中 要 经 受 的 最 大 时 延 ， 


7.5.3 区 分 服务 


在 学 习 了 提供 多 种 类 型 服务 的 动机 、 见 解 和 特定 的 机 制 后 ， 我 们 将 注意 力 集 中 于 以 举 
例 方 式 学习 提 供 多 种 类 型 服务 的 方法 ， 即 因特网 区 分 服务 (Diffserv) 体系 结构 [RFC 
2475; Kilkki 1999 | 。Diffserv 提供 服务 区 分 ， 也 束 是 在 因特网 中 以 一 种 可 扩展 性 方式 用 不 
同 的 方法 处 理 不 同类 型 流量 的 能 力 。 可 扩展 性 的 需求 来 源 于 这 样 的 事实 : 在 因特网 的 一 个 
主干 路 由 需 上 同时 存在 几 十 万 个 源 到 目的 地 的 并 行 流 。 我 们 很 快 将 看 到 ， 仅 仅 通过 在 网 络 
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MoU lal PAGE, MEREKA A SER RPE. ROT Da E A i BE = 
我 们 从 图 7-25 中 显示 的 简单 网 络 开 始 讨 论 。 这 里 我 们 将 描述 Diffserv 的 一 种 可 能 用 
法 。 如 RFC 2475 中 所 摘 述 ， 其 他 的 变化 是 可 能 的 。 区 分 服务 体系 结构 由 两 个 功能 元 素 的 
集合 所 组 成 : 
© 边界 功能 : 分 组 分 类 和 流量 调节 .在 网 络 的 人 边 绿 (也 就 是 ， 或 者 在 产生 流量 的 
Diffserv 使 能 的 主机 ， 或 者 在 流量 经 过 的 第 一 个 Diffserv 使 能 的 路 由 部) ， 到 达 的 分 组 
mar 更 具体 地 说 ， 在 IPv4 或 者 IPv6 分 组 首部 中 的 区 分 服务 (DS) 字段 被 设置 
JEME | RFC 3260]. 该 DS 字段 的 定义 意欲 取代 我 们 在 第 4 草 中 讨论 的 IPv4 服务 
a 子 段 和 IPv6 流量 类 型 字段 .例如 ， 在 网 7-25 中 ， 从 Hl IZE) H3 的 分 组 可 能 
在 R1 被 标记 ， 而 从 H2 发 送 到 H4 的 分 组 可 能 在 R2 被 标记 。 分 组 得 到 的 标记 标识 了 
该 分 组 所 属 的 流量 类 型 。 然后 不 同类 型 的 流量 将 在 核心 网 络 接受 到 不 同 的 服务 
e 核心 功能 : 转发 ， 当 一 个 DS 标记 的 分 组 到 达 一 个 Diffserv HERE AY AR A AREY, ASE 
与 分 组 类 型 相 天 的 所 请 的 每 跳 行为 ( Per-Hop Behavior，PHB)， 该 分 组 被 转发 到 万 
的 下 一 跳 ， 每 跳 行 为 影响 在 葛 争 的 流量 类 型 之 间 共 日 路 由 闪 绥 人 存 和 链 路 审 寓 的 方 
式 。Diffser 体系 结构 的 一 个 关键 原则 是 路 由 天 的 每 跳 行 为 只 基于 分 组 标记 ， 即 分 
组 所 属 的 流量 类 型 . 因此， 如 果 图 7-25 中 从 HI 发 送 到 H3 的 分 组 和 从 H2 发 送 到 
H4 的 分 组 收 到 同样 的 标记 网络 路 由 带 则 将 这 些 分 组 处 理 为 一 个 聚合 体 ， 而 不 区 
ill x HE ap ZR TF Hl 还 是 源 于 H2， 例 如， 当 这 些 分 组 回 R4 转发 时 ，R3 不 区 分 
从 HI 和 1H2 产生 的 分 组 。 AE, Diffserv 体系 结构 消除 了 为 各 个 “ 源 到 目的 地 ” 
对 而 保留 路 由 疹 状 态 的 要 求 ， 这 是 使 Diffserv 具有 可 扩展 性 的 一 个 重要 考虑 . 





图 例 : 


AA UTRA SD 核心 路 由 器 





图 7-25 一 个 简单 的 Diffserv 网 络 例子 


这 里 有 一 个 类 比 可 能 有 助 于 理解 相关 概念 。 在 很 多 大 规模 的 社交 活动 中 (例如 ， 一 场 
JHA \ 众 招待 会 ， 一 场 大 型 的 跳舞 俱乐部 活动 或 者 迪斯科 舞会 ， 一 场 音 乐 会 或 者 一 场 足 


球赛 ) ， 参 加 活 ani) ANG 种 类 型 的 和 场次。 XT TAR a BA Ay VIP ADI; XF 
21 岁 或 者 年 龄 更 大 的 人 有 21 岁 以 上 的 入 场 券 (例如 是 否 可 以 圣 受 酒 类 饮料 ); 对 于 演唱 
人 员 有 后 台 和 场 券 ; 对 于 记者 有 新 闻 入 场 券 ; 对 于 普通 人 有 普通 的 入 场 券 。 这 些 入 场 券 通 
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弟 在 该 活动 的 人 口 分 发 ， 也 就 是 在 活动 的 边 绿 进行 分 发 。 正 是 在 边缘 ， 进 行 着 计算 密集 型 
操作 ， 例 如 交 入 场 费 、 ee 查 邀 请 与 证 件 。 此 外 ， 对 于 人 允许 进 
入 一 个 活动 的 特定 类 型 的 人 数 可 能 有 限制 。 如 果 有 这 种 限制 ， 人 们 可 能 在 进入 活动 之 前 必 
须 等 待 ， 一 旦 进入 了 活动 ,一 个 人 的 入 场 券 使 他 在 活动 中 的 很 多 场所 接受 有 区 别 的 服务 ， 
如 为 VIP 提供 免费 的 饮料 、 较 好 的 果子 、 免 费 食 物 、 单 独 的 房间 和 有 殷勤 的 服务 。 与 之 相对 
照 的 是 ， 一 个 普通 人 禁止 进入 某 些 区 域 ， 要 为 饮料 支付 费用 ， 并 且 只 受到 基本 服务 ， 在 这 
两 种 情况 下 ， 活 动 中 得 到 的 服务 只 依赖 于 入 场 券 的 类 型 。 而 且 在 同一 类 型 的 所 有 人 得 到 相 
辣 的 对 待 

图 7-26 提供 了 了 在 边缘 路 由 融 中 分 类 和 标记 功能 的 逻辑 视图 到 达 边 绿 路 由 天 的 分 组 
首先 被 分 类 ， 分 类 各 根据 一 个 或 多 个 分 组 首部 字段 的 值 (例如 源 地 址 、 目 的 地 址 、 源 端 
口 、 目 的 高 口 和 协议 ID) 来 选择 分 组 ， 并 引导 该 分 组 去 做 合适 的 标记 功能 。 如 前 面 所 指 
出 的 ， 分 组 的 标记 携 审 在 分 组 首部 的 DS 字段 中 。 

在 某 些 情况 下 ， 端 用 户 可 能 已 经 同意 限制 其 分 组 发 送 速 率 以 符合 某 个 申报 的 流量 配置 
LİF (traffic profile ) 。 该 流量 配置 文件 可 能 包含 对 峰值 速率 和 分 组 流 的 突 发 度 的 限制 ， 如 
我 们 前 面 在 潮 棚 机 制 中 所 见 。 只 要 用 户 以 符合 协商 的 流量 配置 文件 的 方式 癌 网 络 中 发 送 分 
组 ，j 这 些 分 组 就 会 得 到 它们 的 优先 级 标记 ， 并 沿 痢 到 目的 地 的 路 径 转 发 。 为 一 方面 ， 如 果 
违反 了 该 流量 配置 文件 . 那些 超出 流量 配置 文件 的 分 组 就 可 能 被 打上 不 同 的 标记 ， 或 被 整 
形 ( 例 如， 为 了 能 够 遵守 最 大 速率 限制 而 延 时 )， 或 可 能 在 网 络 边 缘 被 天 弃 。 图 7-26 中 所 示 
的 测定 功能 (metering function) 的 作用 是 比较 进入 的 分 组 流 和 协商 的 流量 配置 文件 ， 并 确定 
某 分 组 是 否 在 协商 的 流量 配置 文件 之 内 。 有 关 是 否 立 即 重新 标记 、 转 发 、 延 时 或 者 丢 齐 一 个 
人 组 的 实际 决定 是 由 网 络 管理 员 决 定 的 策略 问题 ， 而 不 是 由 Diffserv 体系 结构 规定 的 。 





医 7-26 在 冰 路 由 需 上 的 分 组 分 类 与 流量 调节 的 了 迎 辑 视图 


到 现在 为 止 ， 我 们 一 直 关 注 兰 Diffser 体系 结构 中 的 标记 和 监管 功能 。Diffserv 体系 结 
爸 的 第 二 个 关键 组 件 涉 及 由 Diffserv 使 能 路 由 器 所 执行 的 每 跳 行 为 (PHB) 。 该 每 跳 行 为 有 
点 神秘 ， 但 被 仔细 地 定义 为 “Diffserv 结 点 的 外 部 可 观察 的 转发 行为 的 描述 ， 该 结 点 应 用 
] 一 个 特定 的 Diffserv 行为 聚合 ”[ REC 2475 ] 。 和 微 深入 地 钻研 一 下 这 个 定义 ,我 们 可 以 
看 到 它 里 面包 含 的 几 个 重要 的 考虑 : 
。 PHB 能 够 导致 不 同 服务 类 型 的 流量 接收 到 不 同性 能 ( 即 不 同 的 外 部 可 观察 的 转发 
TH). 
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e 虽然 PHB 定义 了 在 各 种 类 型 之 间 的 性 能 (ITH) Æl, BENRA FRIA 
行为 的 任何 特定 机 制 . 只 要 外 部 可 观察 的 性 能 准 i 得 到 满足 ， 任 何 实 现 机 制 T: 
T/T R nS AG AT LEH. 例如， 一 个 PHB 将 不 要 求 使 用 一 个 特定 的 分 
组 排队 规则 (例如 优先 级 队列 、WFQ 队列 或 FCFS 队列 ) 以 取得 特定 的 行为 
PHB 是 最 后 的 结果 ， 资 源 分 配 和 实现 机 制 是 达到 PHB 的 手段 . 

o 性 能 的 差别 必须 是 可 观察 的 ， 因 而 是 可 测量 的 。 

Beng 两 种 PHB, 一 种 是 加 速 转发 PHB | RFC 3246 | ， 另 一 种 是 硝 剑 和 转发 PHB 

97 | 。 加 速 转发 (Expedited Forwarding, EF) PHB 规定 了 一 类 流明 离开 路 由 入 的 
meh roe 和 于 或 者 大 于 某 个 已 配置 的 速率 ， WREE (Assured Forwarding, AF) PHB 将 
流量 分 为 4 类， 其 中 每 个 AF 类 都 确保 提供 某 种 最 小 数量 的 市 沈 和 绥 存 。 

我 们 通过 对 Diffserv 的 服务 模型 进行 一 些 观察 来 结束 对 Diffserv 的 讨论 首先 ， FRAT Ka 

含 地 假设 Diffserv 部 署 在 单个 管理 域 中 ,但 典型 情况 是 端 到 端的 服务 必须 在 跨越 通信 端 系 
统 之 间 的 多 个 ISP 来 形成 。 为 了 提供 端 到 闪 的 Diffserv 服务 ， 冰 系统 之 加 的 所 有 ISP 不 仅 必 
须 提供 这 种 服务 ， 而 且 为 了 同 端 用 户 提 供 真 正 的 端 到 闹 服 务 ， 多 数 ISP 之 问 也 要 协作 并 作 
ae 如 果 没 有 这 种 协作 ， 直 接 癌 客户 出 售 Diffserv 的 SP 会 发 现 他 们 将 重复 地 说 :“ 是 
， 我 们 知 记 你 支付 了 额外 费用 ， 但 是 我 们 与 丢弃 和 延 述 你 的 流量 的 ISP 之 回 没 有 服务 约 
Eo FEAR TLE VEIT VoIP 电话 中 有 很 多 间隙 !” 第 二 ， 如 果 Diffserv 实际 存在 并 且 该 网 络 
运行 的 负载 不 大 ， 大 多 数 时 间 尽 力 而 为 服务 和 Diffserv 服务 之 间 将 没有 可 觉察 的 差 宣 ”的 
确 ， 端 到 端 时 延 通 帝 是 由 接 人 速率 和 路 由 融 跳 数 造成 的 ， 而 不 是 用 路 由 天 中 的 排队 时 延 造 
成 的 。 想 象 一 个 文 付 了 增值 服务 费用 的 不 幸 的 Diffserv 客户 ， 发 现 为 其 他 人 提供 的 尽力 而 
为 服务 几乎 总 是 具有 与 增值 服务 相同 的 性 能 1! 


7. 5.4 每 连接 服务 质量 保证 : 资源 预约 和 呼叫 准 入 


在 前 一 节 中 ， 我 们 已 经 看 到 了 分 组 标记 和 监管 、 流 量 隔 离 以 及 链 路 级 调度 能 够 为 一 类 
服务 提供 比 另 一 类 更 好 的 性 能 。 在 某 些 调度 规则 下 ， 如 优先 权 调 度 ， 较 低 类 型 的 流量 基本 
对 最 高 优先 权 类 型 的 流量 是 “不 可 见 ” 的 。 依 助 于 适当 的 网 络 定 制 ， 最 高 类 型 的 服务 的 硝 
能 够 取得 极 低 的 丢 包 和 时 延 ， 即 基本 上 是 类 似 于 电路 的 性 能 . 但是， 这 种 网 络 能 够 确保 一 
个 在 高 优先 权 流 量 类 型 中 的 进行 流 ， 仪 使 用 我 们 已 经 描述 的 这 些 机 制 就 能 在 整个 流 期 间 持 
续 得 到 这 样 的 服务 吗 ” 答 案 是 否定 的 。 在 本 节 中 ,我们 将 看 到 当 对 各 个 连接 提供 便服 务 保 
证 时 ， 为 什么 还 需要 另外 的 网 络 机 制 和 p 

我 们 返 回 7.5.2 节 的 场景 中 ， 考 虑 
两 个 1 Mbps 的 音频 应 用 经 1. 5Mbps 的 链 
路 传输 它们 的 分 组 ， 如 图 7-27 所 示 。 这 
ae a (2Mbps) 超过 了 

这 条 链 路 的 容量 。 即 使 使 用 分 类 和 标记 、 
流量 隔离 以 及 闪 部 未 使 用 的 带宽 这 里 
并 没有 未 使 用 的 审 宽 ) ， 这 很 明显 还 是 一 

个 与 丢 包 有 关 的 命题 。 只 是 因为 没有 足 
inane 宽 同 时 满足 两 个 应 用 的 需求 。 如 ”图 7-27 两 个 竞争 的 音频 应 用 过 载 RIB) R2 的 链 路 
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FS 1k PY A i HE a SEE rie HE, BE PV HE HE 25% 的 传输 分 组 ,这 是 一 个 无 
法 接受 的 低 QoS， 以 至 于 两 个 音频 应 用 完全 不 可 用 ; 甚至 从 一 开始 就 没有 必要 传输 任何 
疝 频 分 组 
在 网 7-27 中 两 个 应 用 不 能 同时 满足 的 情况 下 ， 这 个 网 络 应 当做 些 什么 呢 ? 如 果 允 许 
两 者 以 一 种 不 可 用 的 QoS 继续 在 应 用 流 上 良 费 网 络 资源 ， 最 终 将 无 法 回 站 用 户 提 供 任 何 歼 
用 ,希望 该 答案 是 清晰 的 ， 即 应 用 流 中 的 一 个 应 当 被 阻 窒 ( 即 拒绝 接 入 网 络 )， 市 为 一 个 
应 当 人 允许 继续 进行 ， 使 该 应 用 使 用 所 需 的 全 部 1Mbps. 电话 网 是 一 个 执行 这 种 呼叫 阻 窟 的 
网 络 例子 ， 即 如 果 要 求 的 资源 (在 电话 网 的 情况 下 是 一 个 端 到 端的 电 足 ) 不 能 分 配给 该 呼 
册 ， 该 呼叫 就 被 阻塞 了 (阻止 进入 网 络 )、 并 且 返 回 给 用 户 一 个 忙 信和 号。 在 我 们 的 例子 中 ， 
如 果 一 个 流 没 有 分 配 到 足够 的 QoS 来 使 日 己 可 用 ， 人 允许 它 进 入 网 络 没有 任何 好 处 的确， 
接纳 一 个 不 能 得 到 它 雷 要 的 QoS 的 流 是 要 付出 代价 的 ， 因 为 网 络 资源 被 用 于 支持 一 个 对 端 
用 户 没 有 用 的 流 . 
通过 基于 流 的 资源 要 求 以 及 已 经 准 入 流 的 资源 要求 明确 地 准 入 或 阻 寨 流 ， 网 络 能 够 你 
证 准 入 流 可 得 到 它们 所 请 求 的 QoS. 这 隐 含 的 意思 是 : 需要 为 流 提 供 有 保证 的 QoS 就 需要 
流 来 申告 它 的 QoS 需求 。 让 流 申 告 它 的 QoS 需求 ， 然 后 让 网 络 接受 该 流 (以 所 要 求 的 
QoS) 或 者 阻塞 该 流 的 过 程 称 为 呼叫 准 入 (call admission) 过 程 . 这 则 是 我 们 的 第 4 A 
解 〈 除 卫 7.5.2 节 中 前 面 3 个 见解 外 ) ， 该 见解 增加 了 提供 QoS 所 需 的 机 制 
见解 4: 如 果 充 分 的 资源 不 总 是 可 用 的 ， 并 且 要 确保 Qo05， 则 需要 一 个 呼叫 准 入 过 程 ， 
在 这 个 过 程 中 流 申 告 其 QS 需求 ， 然 后 要 人 么 被 网 络 准 入 (以 所 要 求 的 QoS)， 要 么 被 网 络 
阻塞 (如 果 网 络 不 能 提供 所 要 求 的 QoS ) 
如 果 一 个 呼叫 (一 个 端 到 病 流 ) 一 旦 开始 就 要 被 确 体 给 定 的 服务 质量 ， 则 我 们 在 
图 7-27 中 的 启发 性 例子 强调 了 对 几 种 新 的 网 络 机 制 和 协议 的 笛 求 : 
© 资源 预 留 。 为 了 满足 一 个 呼叫 所 布 望 的 QoS， 确保 它 具 有 所 震 的 资源 ( 链 路 市 宽 、 
SAS) 的 唯一 方法 是 显 式 地 为 该 呼叫 分 配 这 些 资 源 ， 用 网 络 的 行 话 来 讲 ， 该 过 程 
称 为 资源 预 留 (resource reservation) ， 一旦 呼叫 预约 了 资源 ， 它 在 其 整个 过 程 中 近 
宕 访问 这 些 资 源 ， 而 不 管 所 有 其 他 呼叫 的 需求 。 如 果 一 个 呼叫 预约 并 得 到 链 路 刘 
宽 的 YMbps 的 保证 ， 而 且 传 输 速 率 决 不 大 于 xYMbps， 则 该 呼叫 将 有 具有 无 玉 包 和 无 
时 延 的 性 能 . 
e 呼叫 准 入 。 如 果 预 留 了 资源 ， 则 该 网 络 必须 有 具有 一 种 用 于 呼叫 请 求 和 预 留 资源 
的 机 制 。 由 于 资源 不 是 无 限 的 ， 如 果 请 求 的 资源 不 可 用 ， 则 进行 呼叫 准 入 请 求 
的 呼叫 将 被 拒绝 准 入 ， 即 被 阻 里 电话 网 执行 的 是 这 种 呼叫 准 和 机制 ， 即 当 我 
们 拨 一 个 号 码 时 ， 就 请 求 了 资源 如果 完成 该 呼叫 所 震 的 电路 (TDMA 时 院 ) 
是 可 用 的 ， 则 分 配 电 路 并 且 完 成 了 呼叫 。 如 果 电 路 不 可 用 ， 则 该 呼叫 被 阻塞 ， 
我 们 得 到 了 忙 信 号 。 为 了 得 到 网 络 的 准 入 ,被 阻塞 的 呼叫 能 够 一 再 尝试 ， 但 是 
直到 它 成 功 地 完成 呼叫 准 人 过 程 ， 才 被 允许 同 网 络 发 送 流量 当然， 分 配 链 路 
市 宽 的 路 由 赫 ， 其 分 配 的 审 宽 不 应 当 超 过 链 路 可 用 的 审 宽 .， 通 笛 ， 一 个 呼叫 仅 
能 预约 一 条 链 路 的 读 蜗 的 一 部 分 ， 因 此 一 台 路 由 大 可 以 为 多 于 一 条 呼叫 分 配 链 
iro 然而 ， 如 果 要 提供 便服 务 质量 傈 证 的 话 ， 为 所 有 了 呼叫 分 配 的 市 宽 总 和 
应 当 小 于 该 链 路 的 容量 . 








e Foy se 424 A ERRAI IEU ME At Re Bok — ROE i AE AY oe E H AHE 
在 每 台 网 络 路 由 需 中 能 够 预约 充足 的 资源 ， 以 确保 满足 它 的 端 到 端 QoS 请 求 . BE 
台 路 由 天 必须 决定 会 话 所 请 求 的 本 地 袖 源 ， 考 虑 已 经 本 Wo 话 的 
并 源 量 ， 并 决定 它 是 否 有 足够 的 资源 来 满足 在 这 人 台中 由 大 上 的 该 会 话 的 每 跳 QoS 
要 求 ， 而 不 违反 对 所 有 已 经 准 入 的 会 话 作 出 的 本 地 QoS 保证 。 和 需要 lp 协议 
来 协调 这 些 各 种 各 样 的 活动 ， 即 本 地 资源 的 每 跳 分 配 ， 以 及 该 呼叫 是 否 能 够 在 治 
各 闪 到 冰 路 径 上 的 每 台 路 由 理 中 预约 充分 的 资源 。 这 是 如 图 7-28 所 示 的 呼叫 建立 
协议 (call setup protocol) 的 任务 ,资源 预 留 协议 (resource ReSerVation Protocol, 
RSVP) | Zhang 1993, RFC 2210| 就 是 在 因特网 体系 结构 中 为 此 目的 所 提出 的 ， 
用 于 提供 服务 质量 保证 ,在 ATM 网 络 中 ，Q2931b 协议 [Black 1995] 在 ATM 网 
络 的 交换 机 和 冰点 之 间 杯 载 了 这 种 信息 ， 





图 7-28 呼叫 建立 过 程 


尽管 投入 了 巨大 的 人 研究 和 开发 力量 ， i 连接 服务 质量 保证 的 产 

日 是 几乎 没有 这 种 服务 的 扩展 部 署 。 有 许多 可 能 的 原因 。 首当其冲 的 是 ， 情 总 很 可 能 

是 我 们 在 7.2 ~7.4 市 学 习 的 简单 的 应 用 级 机 制 与 适当 eg Tal Tl. A 

多 媒体 应 用 提供 了 “足够 好 的 ”尽力 而 为 的 网 络 服务 。 此 外 ，ISP 判断 : 提供 每 连接 服务 

证 所 震 的 附加 复杂 性 以 及 部 署 和 管理 网 络 的 成 本 ， 相 对 于 该 服务 可 预测 的 用 户 收 
， 前 者 可 能 过 高 . 


7.6 me 


多 媒体 网 络 是 当今 因特网 中 最 为 激动 人 心 的 发 展 之 一 ， 全 世界 的 人 们 在 收音 机 和 电视 
机 面前 花费 的 时 间 越 来 越 少 ， 而 转向 通过 因特网 来 接收 音频 和 视频 传输 ， 它 们 包含 了 实况 
转播 和 预先 录制 的 节目 。 随 着 高 速 无 线 因特网 接 入 变 得 越 来 越 无 所 不 在 ， 该 趋势 无 疑 将 继 
EFE. 此外， 借助 于 如 YouTube 这 样 的 网 站 ， 用 户 除了 是 多 媒体 因特网 内 容 的 消费 者 、 
也 成 为 了 生产 者 ,| 除了 视频 分 发 ， 因 特 网 也 正在 用 于 传输 电话 。 事实 上 ,经 过 下 一 个 10 
年 ， 因 特 网 连同 无 线 因特网 接 入 ， 可 能 致使 传统 的 电路 交换 电话 系统 成 为 明日 黄花 。VolP 
不 仅 提 供 了 廉价 的 电话 服务 ， 而 且 将 提供 大 量 的 增值 服务 ， 例 如 视频 会 议 、 在 线 日 录 服 
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务 、 语 音 消息 及 融入 如 脸谱 和 Google + 等 社交 网 络 。 

在 7.1 节 中 ， 我 们 描述 了 视频 和 语音 的 内 在 特点 ， 将 多 媒体 应 用 分 为 3 种 类 型 : (1i) it 
式 存储 音频 /视频 ; (Ci) ASIP 语音 /视频 ; (iii) 流 式 实况 音频 /视频 ， 

在 7.2 节 中 ,我 们 更 为 深入 地 学 习 了 流 式 存储 视频 。 对 于 流 式 视频 应 用 ， 预 先 录 制 的 
视频 放置 在 服务 右上 ， tnd mi 我 们 看 到 流 式 视 
频 系 统 能 够 被 分 为 三 种 类 型 : UDP 流 、HTTP 流 和 适应 性 HTTP 流 。 尽 省 有 所 有 这 二 类 系统 
都 在 实践 中 得 到 了 应 用 ， 但 是 今天 的 系统 绝 大 多 数 应 用 了 HTTP 流 和 适应 性 HTTP 流 。 我 
们 观察 到 对 于 流 式 视频 的 最 为 重要 的 性 能 测量 是 平均 否 吐 量 。 在 7.2 节 中 我 们 也 人 研究 了 
CDN, CDN 有 助 于 在 全 世界 向 用 户 分 发 巨 量 的 视频 数据 。 我 们 也 展望 了 3 个 大 型 因特网 视 
Hh ZS ol yr ee Fe AR. Netflix, YouTube 和 “看 看 ”- 

TS Te ATN E ERD NEE EES eh ee nw eT ane ee me 
络 上 的 方法 。 对 于 会 话 式 多 媒体 ， 定 时 考虑 是 重要 的 ， 因 为 会 话 式 应 用 是 高 度 时 延 敏感 
的 。 在 田 一 方面 ， 人 话 式 多 媒体 应 用 是 于 包容 忍 的 ， 即 偶尔 的 丢 包 仅 会 在 音频 /视频 播放 
中 引起 偶尔 的 十 扰 信和 号， 并且 这 些 丢 包 和 常常 能 被 部 分 地 或 者 全 部 地 掩盖 。 我 们 看 到 将 客户 
缓存 、 分 组 序号 和 时 间 惟 结合 起 来 的 方法 ， 极 大 地 缓解 了 网 络 引 入 的 时 延 拌 动 的 影响 。 我 
们 也 展望 了 Skype 所 依赖 的 技术 ，Skype 是 IP 语音 和 1IP 视频 界 的 领头 公司 之 一 。 在 7.4 节 
中 ， 我 们 学 习 了 两 种 最 为 重要 的 用 于 VoIP 的 标准 化 协议 ， 即 RTP 和 SIP. 

在 7.5 节 中 ， 我 们 介绍 了 几 种 网 络 机 制 ( 链 路 级 调度 规则 和 流量 监管 ) 是 如 何 用 于 在 
几 类 流量 之 则 提供 区 分 服务 的 ， 


课 后 习题 和 问题 
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R1， 针 对 Victor Video 正在 观看 4Mbps 视频 ，Facebook Frank 每 20 秒 钟 观看 一 幅 新 的 100KB 图 片 ， 以 及 
Martha Music 正在 听 200kbps 音频 流 的 情况 ， 重 新 构造 7-1 表 。 

R2. 在 视频 中 有 两 种 类 型 的 元 余 。 描述 它们 ， 并 讨论 如 何 能 够 利用 它们 进行 有 效 压 缩 

OS EO E E S 


AY nae 2H) i :是 多 少 ? 
R4. 多 媒体 应 用 能 够 分 为 三 种 类 型 。 闸 述 它们 的 名 称 并 对 每 种 类 型 进行 描述 . 
7.2 节 


R5. 流 式 多 媒体 系统 能 够 分 为 三 种 类 型 .阐述 它们 的 名 称 并 对 每 种 类 型 进行 描述 . 

R6. 列举 UDP 流 的 三 种 缺点 

R7. 对 于 HTTP 流 ，TCP 接收 缓存 和 客户 应 用 缓存 是 相同 的 东西 吗 ” 如 果 不 是 ,它们 是 怎样 交互 的 呢 ? 

R8. 考虑 对 于 HTTP 流 的 简单 模型 。 假 设 服务 器 以 2Mbps 的 恒定 速率 发 送 比 特 ， 并 且 当 已 经 接收 到 800 万 
比特 时 开始 播放 . 初始 缓存 时 延 1, 是 多 少 ? 

R9. CDN 通常 采用 两 种 不 同 的 服务 器 放置 厚 则 之 一 -阐述 它们 的 名 称 并 简要 地 摘 述 这 两 种 序 则 。 

RIO. 在 7.2.4 节 中 描述 了 几 种 集群 选择 策略 。 这 些 策略 中 的 哪 一 种 找到 了 相对 于 客户 的 LDNS 的 一 个 好 
集群 ”这 些 策略 中 的 哪 一 种 找到 了 相对 于 客户 自己 的 一 个 好 集群 ? 

R11. 除了 诸如 时 延 、 丢 包 和 带宽 性 能 等 网 络 相 关 的 考虑 ， 设 计 一 种 集群 选择 策略 时 有 许多 附加 的 重要 因 
Aimee elk. EA ape? 
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R12. 端 到 端 时 延 和 分 组 时 延 拌 动 的 区 别 是 什么 ”分 组 时 延 拌 动 的 原因 是 什么 ? 

R13. 为 什么 在 预定 的 播放 时 间 之 后 收 到 的 分 组 被 认为 是 丢失 了 ? 

R14. 7. 3 节 描 述 了 两 种 FEC 方案 ， 简 要 地 总 结 它们 ， 这 两 种 方案 通过 增加 开销 而 增加 了 流 的 传输 速率 . 
交织 技术 也 会 增加 传输 速率 吗 ? 

7.4% 

RIS. 接收 方 如 何 识别 在 不 同 会 话 中 的 不 同 RTP 流 ” 同 一 个 会 话 中 的 不 同 流 是 怎样 识别 的 ? 

R16. SIP 注册 器 的 作用 是 什么 ”一 个 SIP 注册 器 的 作用 与 移动 IP 中 的 归属 代理 的 作用 有 怎样 的 差异 ? 

7.5 节 

R17. 在 7.5 节 ， 我 们 讨论 了 非 抢 占 优先 级 排队 。 抢 占 优先 级 排队 是 什么 ? 抢占 优先 级 排队 对 于 计算 机 网 
络 有 意义 吗 ? 

R18. 举 一 个 非 保持 工作 的 调度 规则 的 例子 . 

R19. 举例 说 明 你 的 日 常生 活 中 所 经 历 的 FIFO、 优 先 权 、RR 和 WFQ 的 排队 。 





Pl. 考虑 下 图 。 类 似 于 我 们 对 图 7-1 的 讨论 ， 假设 视频 以 固定 比特 率 进行 编码 ， 因 此 每 个 视频 块 包 含 
在 相同 的 固定 时 间 量 A 播放 的 视频 帧 。 服 务 器 在 to 时刻 传输 第 一 个 视频 块 ， 在 to + A 时 刻 传输 第 二 
Ik, TE ty +2 时 刻 传输 第 三 块 ， 等 等 。 一 旦 客户 开始 播放 ， 每 个 块 应 当 在 前 一 块 后 播放 A 时 间 
单元 。 

a. 假设 第 一 块 在 4 时 刻 一 到 达 ， 客 户 就 开始 播放 。 在 下 图 中 ， 多 少 视频 块 (包括 第 一 块 ) 将 及 时 到 

达 客 户 供 其 播放 ? 解释 你 怎样 得 到 该 答案 的 ， 

. 假设 该 客户 现在 在 4 + A 时 刻 开始 播放 . 多 少 视频 块 (包括 第 一 块 ) 将 及 时 到 达 客 户 供 其 播放 ? 

解释 你 怎样 得 到 该 答案 的 。 

c. 在 如 上 面 (b) 的 相同 场景 中 ， 存 储 在 客户 缓存 中 等 竺 播放 的 块 的 最 大 数量 有 多 少 ? 解释 你 皇 样 

得 到 该 答案 的 ， 

. 在 客户 中 为 使 每 个 视频 块 及 时 到 达 供 其 播放 ， 最 小 的 播放 时 延 是 多 少 ? 解释 你 怎样 得 到 该 答案 的 。 
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时 间 
P2. 回想 在 图 7-3 中 显示 的 HTTP 流 的 简单 模型 。 前 面 讲 过 8B 表示 客户 应 用 缓存 的 长 度 ，Q 表示 在 客户 应 
用 缓存 开始 播放 之 前 必须 被 缓存 的 比特 数量 。 还 有 7r 表示 视频 消耗 速率 ,假设 无 论 何 时 客户 缓存 不 
满 ， 服 务 器 都 以 恒定 速率 x 发送 比特 。 
a. 假设 x<rs。 如 在 本 书 所 讨论 ,在 此 场合 播放 将 在 连续 播放 期 和 停 下 期 之 间 变 动 。 作为 @、r~ 和 x 的 
蜗 数 ， 人 确定 每 个 连续 播放 和 停 洲 期 的 长 度 。 
b. 现在 假设 x > rs。 求 客 户 应 用 缓存 变 满 的 时 刻 t = 0,7 
P3. 回想 在 图 7-3 中 显示 的 HTTP 流 的 简单 模型 。 假 设 缓 存 长 度 是 有 限 的 ， 并 服务 器 以 可 变 的 速率 x(1) 


发 送 比特 . 具体 而 言 ， 假 设 x(t) 具有 下 列 锯齿 形状 。 其 速率 在 时 刻 上 =0 PRA, CEMA r= TH 

EERS H. 然后 反复 重复 这 种 模式 ， 如 下 图 中 显示 的 那样 : 

a. 服务 器 的 平均 发 送 速率 是 什么 ” 

b. 假设 0 =0， 客 户 一 接收 到 一 个 视频 块 就 开始 播放 。 将 发 生 什么 现象 ? 

co 现在 假设 0>0。 作 为 0、H 和 7 了 的 陨 数 ,确定 首先 开始 播放 的 时 间 。 

d. 假设 五 >2r Al Q = HT/2. 证 明 在 初始 播放 时 延 之 后 将 不 会 有 停滞 

e. 假设 五 >2r。 求 出 最 小 的 0 值 ， 使 在 初始 播放 时 延 之 后 将 不 会 有 停 沛 。 

f 现在 假定 绥 存 长 度 B 是 有 限 的 。 假定 厂 >2r。 作 为 0、B、7T 和 #H 的 函数 ,确定 当 客 户 应 用 缓存 首 
次 变 满 的 时 刻 =t, 


比特 率 x (7) 


T 2 3T 4T 
时 间 

P4. 回想 在 图 7-3 中 显示 的 HTTP 流 的 简单 模型 。 假 设 客户 应 用 缓存 长 度 是 有 限 的 ， 服 务 右 以 恒定 的 速率 
x RIF, 并且 视频 的 压缩 率 是 +， 其 中 rr<x。 还 假设 播放 立即 开始 。 假设 用 户 早 在 时 刻 1=E 中 止 视 
频 。 在 中 止 的 时 刻 ， 服 务 器 停止 发 送 比特 (如 果 它 还 没有 发 送 视频 中 所 有 上 比特 的 话 ) 。 

a 假设 视频 为 有 限 长 。 问 浪费 了 多 少 比 特 ( 即 发 送 但 未 观看 )? 
b. 假设 视频 为 了 7 秒 长 ， 其 中 7T>E。 问 浪费 了 多 少 比 特 ( 即 发 送 但 未 观看 )? 

PS. 考虑 一 个 DASH RR, HPA AN 个 视频 版 本 (及 种 不 同 的 速率 和 质量 ) 和 WN 种 音频 版 本 (及 种 
不 同 的 速率 和 质量 ) 。 假 设 我 们 要 允许 播放 者 在 任何 时 间 对 任何 N 种 视频 版 本 和 任何 放 种 音频 版 本 
进行 选择 。 

a. 如 采 我 们 生成 文件 ， 使 音频 与 视频 混合 起 来 ， 这 样 服务 需 在 给 定 的 时 间 仅 发 送 一 种 媒体 流 ， 该 服 
务 需 将 需要 存储 多 少 文件 ( 每 个 文件 有 一 种 不 同 的 URL)? 
b. 如 果 服 务 器 单独 发 送 音 频 流 和 视频 流 并 且 让 客户 同步 这 些 流 的 话 ， 该 服务 器 将 需要 存储 多 少 文件 ? 

P6. 在 7.3 WAJ VoIP BFP, Oh 为 加 到 每 个 块 中 的 首部 字 节 总 数 ， 包 括 UDP A IP 的 首部 。 

a. 假设 每 20 秒 钟 发 射 一 个 IP 数据 报 ， 求 出 由 该 应 用 一 侧 产 生 的 数据 报 的 每 秒 传输 速率 (以 比特 计 ) 。 
b， 当 使 用 RTP 时 , h 的 典型 值 是 什么 ? 

P7. 考虑 在 7.3 节 中 描述 估计 平均 时 延 d, 的 过 程 。 假 设 w=0.1。 $r -4 是 最 近 的 采样 时 延 ， 今 r, -4 
是 下 一 个 最 近 的 采样 时 延 ， 等 等 。 

a 对 于 一 个 特定 的 音频 应 用 ,假设 四 个 分 组 到 达 接 收 方 的 采样 时 延 为 r; 一 ts、 ri 一 3、r 一 t Ar o- 
Lo 根据 这 4 个 采样 来 表示 时 延 d 的 估计 值 。 

b. 对 于 个 采样 时 延 归纳 出 公式 。 

c 对 于 b 小 题 的 公式 ， 令 于 趋 于 无 穷 ， 给 出 最 后 的 公式 。 评 论 一 下 为 什么 这 个 平均 过 程 被 称 为 一 个 
指数 移动 平均 数 . | 

P8. 重复 习题 P7 中 的 (a) 和 (b) ， 求 出 平均 时 延 偏 差 的 估计 值 。 

P9. 对 于 7.3 市 中 的 VoIP 例子 ,我 们 引入 了 一 个 估计 时 延 的 在 线 过 程 (指数 移动 平均 数 ) 。 在 本 习题 中 
我 们 将 研究 另 一 种 过 程 。 设 4 是 接收 到 的 第 i 个 分 组 的 时 间 惟 ; 设 是 收 到 第 i 个 分 组 的 时 间 。 令 4d， 
表示 在 收 到 第 n 个 分 组 后 我 们 对 平均 时 延 的 估计 ,在 收 到 第 一 个 分 组 后 ， 我 们 设置 时 延 估 计 值 等 于 
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a) =% =2) 
a. [ei 4 BRI Ahn, Ad, =(r -t +r, -t, + +r, -t,) Ms Hedi d, i, r, Wi, AR 
d, 的 递归 公式 。 
b. 描述 一 下 对 于 VolP， 为 什么 在 7.3 节 中 描述 的 时 延 估 计 比 (a) 部 分 叙述 的 时 延 估计 更 合适 ， 
P10. 比较 7.3 节 描 述 的 估计 平均 时 延 的 过 程 和 3.5 节 估 计 往 返 时 间 的 过 程 。 这 些 过 程 有 什么 相同 ”有 什 
么 不 同 ? 
Pll. 考虑 下 图 ( 它 类 似 于 图 7-7)。 某 发 送 方 在 1=1 时 开始 周期 性 地 发 送 分 组 化 的 音频 。 在 上 =8， 第 一 
个 分 组 到 达 接 收 方 。 







生 的 分 组 一 | 
产生 的 分 


接收 到 的 分 组 一 


Ea a aa lee eer y T e 


8 
时 间 
a. 分 组 2 到 分 组 8 的 时 延 ( 从 发 送 方 到 接收 方 ， 忽 略 任何 播放 时 延 ) 是 什么 ”注意 到 在 该 图 上 每 个 
垂直 和 水 平 线段 具有 1、2 或 3 个 时 间 单 元 的 长 度 。 
b 如 有 果 第 一 个 分 组 在 1=8 时 刻 一 到 达 接 收 方 ， 音 频 就 开始 播放 ， 发 送 的 前 8 个 分 组 中 的 哪些 将 不 
能 按时 到 达 进 行 播放 ? 
c 如 果 在 1=9 时 刻 音频 开始 播放 ， 发 送 的 前 8 个 分 组 中 的 哪些 将 不 能 按时 到 达 进 行 播放 ? 
d. 在 接收 方 ， 导 臻 所 有 前 8 个 分 组 按时 到 达 进 行 播放 的 最 小 播放 时 延 是 什么 ? 
P12. 再 次 考虑 习题 P11 中 的 图 ， 显 示 分 组 音频 传输 和 接收 时 间 。 
a. 计算 分 组 2 到 分 组 8 的 估计 时 延 ， 使 用 7.3.2 节 中 的 对 于 d; 的 公式 。 使 用 w=0.1 的 值 。 
b. 使 用 7.3.2 节 中 对 于 vw 的 公式 ， 从 对 分 组 2 到 分 组 8 的 估计 平均 时 延 计算 其 估计 的 偏差 。 
P13. 在 7.3 节 中 讲 过 VolP 的 两 种 FEC 方案 。 假 设 第 一 种 方案 为 每 4 个 初始 块 产生 一 个 元 余 块 。 假 设 第 
二 种 方案 使 用 传输 速率 为 标 称 流传 输 速 率 的 25% 的 低 比 特 率 编码 。 
a. 每 种 方案 需要 多 少 额 外 带宽 ?每 种 方案 增加 多 少 播放 时 延 ? 
b， 如 果 在 每 组 的 5 个 分 组 中 第 一 个 分 组 丢失 了 ， 这 两 种 方案 如 何 执行 ?” 哪 一 种 方案 有 更 好 的 音频 质量 ? 
c 如 有 果 在 每 组 的 2 个 分 组 中 第 一 个 分 组 丢失 了 ， 这 两 种 方案 如 何 执行 ? 哪 一 种 方案 有 更 好 的 音频 
质量 ? 

P14. a. 考虑 Skype 中 的 一 个 音频 会 议 具 有 N > 2 个 与 会 者 。 假 定 每 个 与 会 者 生成 一 个 速率 rbps 的 恒定 流 ， 
呼叫 的 发 起 方 将 需要 每 秒 发 送 多 少 比 特 ? 其 他 NN -1 个 与 会 者 每 个 都 将 需要 每 秒 发 送 多 少 比特 ” 
聚合 所 有 与 会 者 ， 总 的 发 送 速率 是 多 少 ? 

b. 对 于 使 用 一 台中 心服 务 器 的 一 个 Skype 视频 会 议 ， 重复 (a). 
c. 重复 (b) ， 只 是 现在 情况 为 每 个 对 等 方 发 送 其 视频 流 副本 到 其 他 N -1 个 对 等 方 。 

. 假设 我 们 向 因特网 发 送 两 个 IP 数据 报 ， 每 个 数据 报 携带 不 同 的 UDP 段 。 第 一 个 数据 报 的 源 中 地 
HEH AL, 目的 IP 地址 为 B， 源 端口 为 Pl， 目的 端口 为 T。 第 二 个 数据 报 的 源 IP 地 址 为 A2， 日 的 
IP 地 址 为 B， 源 端口 为 P22， 目的 端口 为 T。 假设 Al 和 A2 Arla], Pl 和 了 包 不同 。 假 设 这 两 个 数据 
报 都 到 达 它 们 的 目的 地 址 ， 这 两 个 UDP 数据 报 会 被 同一 个 套 接 字 接 收 吗 ”为 什么 ? 

b. 假设 Alice, Bob 和 Claire 要 使 用 SIP 和 RTP 来 进行 音频 会 议 呼 叫 。Alice 与 Bob Al Claire 之 间 发 送 
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P16. 


P17: 





Akk RTP 分 组 ， 只 有 一 个 UDP Ejk F Engg (SIP 4R ER m Etk BRR)? 如 果 够 . 那么 
Alice 的 SIP 客户 如 何 区 分 RTP 分 组 是 来 自 Bob 还 是 来 月 Claire? 


EFI Hr a : 

a 如果 存储 视频 直接 从 Web 服务 器 流 式 传输 到 媒体 播放 器 ， 这 个 应 用 则 正在 使 用 TCP 作为 底层 的 
传输 协议 ， 

b. {EJH RTP 时 ， 发 送 方 有 可 能 在 会 话 的 中 间 改 变 编 公 ， 


， 所 有 aft RTP fyi AY i ig H 87. 

d. 假设 一 个 RTP 会 话 对 每 个 发 送 方 有 独立 的 音频 和 视频 流 ， 则 这 些 音频 和 视频 流 使 用 同样 的 SSRC 。 

‘nae 尽管 每 跳 行为 定义 了 各 类 型 之 间 的 性 能 差别 ， 但 它 没有 强制 要 求 为 了 获得 这 些 性 

能 而 使 用 任何 特定 机 制 ， 

f 假设 Alice 要 和 Bob 建立 一 个 SIP 会 话 ， 在 她 的 INVITE 报 文中 包括 了 这样 的 行 : m = audio 48753 
RTP/AVP 3 (AVP 3 指示 GSM 音频 ) ， 因 此 Alice 在 该 报 文 中 指示 她 要 发 送 GSM 调频 

g. 参 基 前 一 句 说 法 ，Alice 在 她 的 INVITE 报 文中 指示 了 她 将 把 音 琐 发 送 到 六 口 48753 

h. SIP 报 文 在 SIP 实体 之 间 通 常 使 用 一 个 默认 的 SIP 端口 号 发 送 

i， 为 了 维护 注册 ，SIP 客户 必须 周期 地 发 送 REGISTER {R X 

j SIP 强制 所 有 的 SIP 客户 支持 G.711 音频 编 但 ， 

假设 对 一 个 支持 3 种 流量 类 型 的 缓存 运用 WFO 调度 策略 、 并 假设 这 3 种 类 型 的 权重 分 别 为 0.5、 

0.25 和 0.25. 
. 假设 每 种 类 型 在 缓存 里 都 有 大 量 的 分 组 .为 了 获得 这 些 WFQ 权重 ,这 3 种 类 型 可 能 以 什么 顺序 
Ee 务 ?( 对 于 循环 调度 ， 一 种 自然 的 序列 为 123123123…) 

b、 假 设 类 型 1 和 类 型 2 在 缓存 中 有 大 量 的 分 组 ， 缓 存 中 没有 类 型 3 的 分 组 .为 了 获得 这 些 WFO 权 

E. x3 ne 么 顺序 接受 服务 
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a 假设 FIFO 服务 ， 指 出 分 组 2 ~ 12 每 个 离开 队列 的 时 间 。 对 每 个 分 组 ， 它 到 达 和 传输 开始 的 时 院 
之 间 的 时 延 是 什么 ”所 有 12 个 分 组 的 平均 时 延 是 什么 ? 

. 现在 假设 优先 权 服 务 ， 并 假设 奇数 编号 的 分 组 是 高 优先 权 ， 偶 数 编号 的 分 组 是 低 优先 权 - 指出 分 
组 2~12 每 个 离开 有 队列 的 时 间 。 对 每 个 分 组 ， 它 到 达 和 传输 开始 的 时 际 之 间 的 时 延 是 什么 ?有 所 有 
12 个 分 组 的 平均 时 延 是 什么 ? 

ce 现在 假设 循环 服务 。 假 设 分 组 1、2、3、6、11 和 12 属于 类 型 1, 分 组 4、5、7、8、9 和 10 属于 
类 型 2。 指 出 分 组 2 ~ 12 每 个 离 开 队 列 的 时 间 对 每 个 分 组 ， We 开始 的 时 隙 之 间 的 时 
延 是 什么 ” 所 有 12 个 分 组 的 平均 时 延 是 什么 ? 

. 现在 假定 加 权 公 平 排队 (WFQ) 服务 。 假 设 奇数 编号 的 分 组 属于 类 型 1， 偶数 编号 的 分 组 属于 类 
型 2。 注意 到 也 许 不 可 能 取得 像 本 书 中 描述 的 那 种 理想 的 WFQ 调度 ， 故 指出 在 每 个 时 际 为 什么 
你 选择 了 特定 分 组 进入 服务 。 对 每 个 分 组 ， 它 到 达 和 传输 开始 的 时 际 之 间 的 时 延 是 什么 ? 所 有 
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12 个 分 组 的 平均 时 延 是 什么 ” 

e. 在 所 有 四 类 (FCFS, RR, (ERA WFO) 的 平均 时 延 中 你 注意 到 什么 ? 

ERAR Ble at P18 中 的 图 。 

a 假设 优先 权 服 务 ， 分 组 1、4、5、6 和 11 为 高 优先 权 分 组 . 余下 的 分 组 是 低 优 先 权 : 指出 分 组 
2 ~ 12 每 个 离开 队列 的 时 际 

b. 现在 假设 使 用 循环 服务 ， 分 组 1、4、5、6 和 和 11 属于 一 类 流量 ， 余 下 的 分 组 属于 第 二 类 流量 ， 指 
出 分 组 2 ~12 每 个 离开 队列 的 时 际 ， 

ce 现在 假设 使 用 WFQ 服务 ,分 组 1、4、5、6 和 11 属于 一 类 流量 , 余下 的 分 组 属于 第 二 类 流量 
类 型 1 具有 的 WFQ 权重 为 1， 而 类 型 2 具有 的 WFQ 权重 为 2 (注意 到 这 些 权 重 与 前 而 问题 中 的 
不 同 )。 指 出 分 组 2 ~ 12 每 个 离开 队列 的 时 隙 也 要 注意 本 问题 中 有 关 WEO 服务 的 提醒 。 

区 起 下 图 ， 图 中 显示 了 一 个 由 分 组 流 提供 输入 的 泌 屈 监管 天 令 牌 桶 能 够 保持 最 多 是 个 令 牌 ， 并 最 初 

在 !=0 时 刻 是 满 的 。 新 的 令 牌 以 每 时 际 1 个 令 牌 的 速率 到 达 。 输 出 链 路 速率 采用 下 列 规划， 如 果 两 个 

分 组 在 一 个 时 际 的 开始 获得 令 牌 它们 能 够 在 相同 的 时 际 中 进入 输出 链 路 。 该 系统 的 定时 细节 如 下 : 


eS 
r=1 A RAYE 
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分 组 队列 
(等 待 令 牌 ) 


1， 分 组 在 时 院 的 开始 到 达 (如 果 有 的 话 ) .因此 在 该 图 中 ， 分 组 1、2 和 3 在 时 际 0 到 达 。 如果 在 队 
列 中 已 经 有 分 组 ， 则 到 达 的 分 组 加 入 该 队列 的 尾部 。 分 组 以 FIFO 方式 朝 着 该 队列 的 前 方 行进 

2， 当 到 达 分 组 增加 进 队 列 之 后 ， 如 果 有 任何 排队 分 组 ， 那 些 分 组 中 的 一 个 或 两 个 (取决 于 可 用 令 牌 
的 数量 ) 将 每 个 从 令 牌 桶 中 去 除 一 个 令 牌 并 在 那个 时 际 去 往 输出 链 路 。 央 此 ,分 组 1 和 2 AH 
中 去 除 一 个 令 牌 〈 因 为 最 初 有 两 个 令 牌 ) 并 在 时 际 0 期 间 去 往 输出 链 路 。 

3， 如 果 今 牌 桶 未 满 则 新 令 牌 加 入 ， 因 为 令 牌 产生 速率 是 r=1 令 牌 /时 院 。 

然后 时 间 前 进 到 下 一 个 时 际 ， 并 且 重 复 这 些 步骤 ， 

回答 下 列 问题 : 

a. 对 每 个 时 隙 ， 在 到 达 分 组 处 理 后 (上述 步 骤 1) 但 在 任何 分 组 通过 队列 传输 并 去 除 一 个 令 牌 之 前 
的 那个 时 刻 ， 指 出 位 于 队列 中 的 分 组 和 位 于 桶 中 的 令 牌 数量 。 因 此 ， 对 于 在 上 述 例 子 中 的 1=0 
时 刻 的 时 际 ， 分 组 1、2 和 3 位 于 队列 中 ， 桶 中 有 两 个 令 牌 

b. 对 每 个 时 际 ， 指 出 在 令 牌 从 队列 中 去 除 后 哪个 分 组 出 现在 输出 链 路 .这样 ， 对 于 上 述 例子 中 的 
t=O 时 际 ， 在 时 际 0 期 间 ， 分 组 1 和 2 从 汤 桶 出 现在 输出 链 路 上 
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. 重复 习题 PP0， 但 假设 r=2。 和 再 次 假设 初始 时 桶 是 满 的 。 
. 考虑 习题 P21 并 假设 现在 r=3 H b=2 与 以 前 一 样 。 你 对 上 述 问 题 的 回答 有 变化 吗 ? 
. 考虑 一 下 监管 分 组 流 的 平均 速率 和 突 发 长 度 的 漏 桶 监管 器 。 我 们 现在 也 要 监管 峰值 速率 p; 说 明 这 


个 漏 棚 监管 占 的 输出 如 何 能 够 提供 给 第 二 个 漏 桶 监管 露 ， 使 得 这 两 个 串 行 的 漏 桶 能 够 监管 平均 速 
率 、 峰 值 速率 和 突 发 长 度 。 要 给 出 第 二 个 监管 器 的 桶 长 度 和 令 牌 产生 速率 。 

如 果 对 于 任何 1 来 说 ， 在 每 个 时 间 间 隔 长 度 1 内 到 达 漏 桶 的 分 组 数 小 于 r+b 个 ， 那么 就 说 分 组 流 符 
合 一 个 突 发 长 度 5b 和 平均 速率 7 的 漏 桶 规范 (r,b)。 一 个 符合 漏 桶 规范 (+r, b) 的 分 组 流 必 须 在 参 
Ber Al b 的 涯 桶 监管 费 那 里 等 待 妈 ?评估 你 的 答案 。 


. WHR E r < RwA( Ew), WA du XR Lii 中 任何 分 组 在 WFQ 队列 中 要 经 受 的 最 大 时 延 
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PAETE 


PAAA P, EAE RR AEP. AA PEHEA (RTSP) SR PE dil AR % A Aa 
f URS RENIEN (RTP) OPE UL EE UDP ki. Ki ARIETE A P RUR A PS Op 
实现 了 RTSP 和 RTP 的 Python (C05. (ROY TEREC A PAR BH RRID. ERR, HEC RAE T — 
个 进行 下 面 工 作 的 客户 - AR ArH: 

e Zik SETUP, PLAY. PAUSE 和 TEARDOWN 等 RTSP 命令 ， 并 且 服 务 器 应 答 这 些 命 令 

e 当 服 务 带 处 于 播放 状态 ， 写 周期 地 抓 取 存储 的 JPEG 帧 用 RTP 对 该 帆 分 组 化 ， 并 将 该 RTP 分 组 

发 送 到 一 个 UDP 套 接 字 中 

e 客户 接收 该 RTP 4H., AER JPEG 帧 ， 解 压缩 该 帧 .并 在 客户 的 监管 名 上 和 再现 该 帧 

为 你 提供 的 代码 在 服务 融 实 现 RTSP 协议 ， 在 客户 实现 对 RTP 解 分 组 化 . 这 个 代码 也 考虑 传输 视频 
的 显示 。 你 需要 在 客户 实现 RTSP 和 RTP 服务 右 。 该 编程 作业 将 极 大 地 增强 学 生 对 RTP, RTSP 和 流 式 视 
频 的 理解 . 我 们 极力 推荐 它 - 该 作业 也 建议 进行 大 量 可 选 的 练习 ， 包 括 在 客户 和 服务 右 实 现 RTSP 的 
DESCRIBE mO (RREI TE Web 站 点 http://www. awl. com/kurose-ross 找到 该 作业 的 全 部 细节 以 及 RTSP 协 
议 的 概述 
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Henning Schulzrinne 是 哥伦比亚 大 学 的 教授 、 计 算 机 科学 系 的 主任 和 因 特 
网 实时 实验 宝 的 负责 人 - 他 是 RTP, RTSP, SIP 和 GIST 这 些 经 因特网 进行 音 
频 和 视频 通信 的 关键 协议 的 作者 之 一 ，Henning 在 德国 达 姆 施 塔 特工 业 大 学 
(TU Darmstadt) 获得 了 电子 和 工业 工程 学 士 学 位 ， 在 辛辛那提 大 学 获得 了 电 
子 和 计 工 机 工程 硕士 学 位 ， 以 及 在 马萨诸塞 大 学 阿 默 斯 特 字 院 获 得 了 电子 工 
程 博 士 学 位 





e 是 什么 使 得 您 决定 致力 于 多 媒体 网 络 ? 

ì ALFE 巧合 ”作为 一 个 博 十 生 ， 我 从 事 DARTnet 方面 的 工作 ，DARTnet 是 一 
个 用 了 线路 跨越 美国 的 实验 网 络 。DARTnet 用 于 为 多 播 和 因特网 实时 工具 提供 场 
所 。 这 促使 我 写 了 我 的 第 一 个 音频 工具 NeVoT。 通 过 一 些 DARTnet 的 参与 者 ， 我 开始 参与 IETF 和 那 时 新 成 
立 的 音频 视频 传输 工作 组 的 工作 . 这 个 工作 组 后 来 完成 了 RTP 的 标准 化 .。 

e 您 在 计算 机 行业 中 的 第 一 份 工 作 是 什么 ” 它 给 了 您 什么 收获 ? 

我 在 计算 机 行业 的 第 一 份 工作 是 在 加 利 福 尼 亚 的 Livermore 读 高 中 时 焊接 一 个 牵 牛 星 (Altair) 计算 
机 工具 包 。 问 到 德国 ， 我 于 了 一 个 小 咨询 公司 来 给 旅行 社 设计 一 个 地 址 管理 程序 ， 为 我 们 的 TRS-80 开发 
了 将 数据 存储 在 磁带 上 的 功能 ， 并 通过 一 个 自己 制作 的 硬件 接口 把 IBM 的 电动 打字 机 作为 打印 机 使 用 。 

我 第 一 份 真正 的 工作 是 在 AT&T 的 贝尔 实验 室 ， 为 在 实验 室 环境 下 构建 实验 网 络 而 研发 的 一 个 网 络 
(i FL ti. 

e 因特网 实时 实验 室 的 目的 是 什么 

我 们 的 目的 是 为 因特网 作为 单一 的 未 米 通 信和 基础 设施 提供 组 件 和 构件 模块 。 这 包括 开发 新 协议 ， 如 
GIST (用 于 网 络 层 信 令 ) 和 LosT (用 于 由 位 置 寻 找 资源 ) ， 或 通过 在 丰富 呈现 、 对 等 系统 、 下 一 代 紧 急 
es 生 工 具 等 方面 的 工作 加 强 我 们 以 前 从 事 的 协议 ， 如 SIP， 最 近 ， 我 们 也 大 规模 地 研究 了 
用 于 VoIP 的 无 线 系统 ， 因 为 802. 11b 和 802. 11n 网 络 以 及 也 许 WiMAX 网 络 有 可 能 成 为 用 于 电话 的 重要 
的 最 后 1 英里 技术 我 们 也 试图 使 用 一 种 称 为 DYSWIS (Do You See What I see， 你 所 见 即 我 所 见 ) 的 对 
每 方 到 对 等 方 故障 诊断 系统 ， 大 大 改进 用 户 在 面 对 提 供 商 和 设备 的 复杂 、 混 乱 问 题 时 的 故障 诊断 能 力 。 

通过 构建 原型 和 开放 源 公 系统 、 测 最 实际 系统 的 性 能 ， 以 及 对 IETF 标准 作出 页 献 ， 我们 试图 做 些 实 
践 性 相关 工作 . 





Henning Schulzrinne 
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e 您 对 多 媒体 网 络 的 未 来 展望 是 什么 ” 
我 们 现在 正 处 于 一 种 过 滤 阶 段 ， 距 离 丰 成 为 从 IPTV 到 VoIP 等 多 媒体 服务 的 通用 平台 只 有 几 年 之 迁 
了 我 们 期 望 着 收音 机 、 电 话 和 电视 即使 在 暴风 两 和 地 震中 部 能 工作 ， 所 以 当 央 特 网 接 奉 了 这 些 专 用 网 

络 的 职责 时 ， 用 户 将 期 竺 有 同样 级 别 的 可 靠 性 。 

我 们 将 不 得 不 学 会 为 一 个 生态 系统 设计 网 络 技 术 ， 该 生态 系统 包括 竞争 的 电信 公司 、 服 务 和 内 容 提 
供 商 ， 服 务 于 大 量 技 术 上 未 受训 练 的 用 户 ， 并 保护 他 们 免 受 少数 但 具 破 坏 性 的 一 批 垩 意 和 犯罪 用 户 的 侵 
害 。 改 变 协 议 变 得 日 益 艰 难 。 协 以 也 变 得 更 为 复杂 ， 因 为 它们 需要 考虑 竞争 的 商业 利益 、 安 全 性 、 隐 私 
以 及 由 防火 墙 和 网 络 地 址 转换 引起 的 网 络 透明 性 的 欠缺 。 

因为 多 媒体 网 络 正 在 成 为 几乎 所 有 消费 者 娱乐 的 基础 ， 因 此 以 低 成 本 管理 非常 大 的 网 络 将 成 为 重点 
用 户 将 期 待 易于 使 用 的 网 络 ， 例 如 可 以 在 所 有 的 设备 上 找到 相同 的 内 容 。 

e 为 什么 SIP 的 未 来 很 有 前 途 ? 

随 着 现在 的 无 线 网 络 正 在 向 3G 网 络 升 级 ， 和 希望 单个 多 媒体 信 令 机 制 能 够 跨越 所 有 类 型 的 网 络 ， 包 
括 从 电缆 调制 解 调 咒 到 企业 电话 网 和 公用 无 线 网 络 。 这 连同 软件 无 线 电 一 道 ， 在 将 来 使 下 列 东西 成 为 可 
HE: 单一 设备 能 被 用 于 家 庭 网 络 中 ， 能 被 作为 无 绳 昌 牙 电话 ， 用 于 经 802. 11 的 企业 网 中 和 经 3G 网 络 的 
广域网 中 。 即使 在 我 们 有 这 样 一 个 通用 的 无 线 设备 之 前 ， 个 人 移动 机 制 使 得 隐藏 网 络 之 间 差 别 成 为 可 能 ， 
一 个 标识 成 为 找到 一 个 人 的 通用 方法 ， 而 不 必 记 住 或 者 分 发 一 堆 特 定 技术 或 特定 位 置 的 电话 号 但 . 

SIP 还 将 提供 语音 〈 比 特 ) 传输 和 语音 服务 分 离 。 现 在 打破 本 地 电话 垄断 在 技术 上 已 成 为 可 能 ， 即 
一 个 公司 提供 中 性 的 比特 传输 ， 其 他 的 公司 提供 IP“ 拨 号 音 ” 和 和 常用 的 电话 服务 ， 例 如 网 关 、 呼 叫 转移 
和 主 叫 者 ID, 

除了 多 媒体 信 令 ，SIP 提供 在 因特网 中 缺少 的 一 种 新 服务 : 事件 通知 。 我 们 已 经 有 了 这 种 有 具有 HTTP 
不 完善 系统 和 电子 邮件 功能 的 近似 服务 ， 但 是 这 决 不 会 邻 人 非常 满意 。 因 为 事件 是 对 分 布 式 系统 的 通用 
抽象 ， 这 样 可 能 简化 新 服务 的 构建 . 

o 你 对 进入 到 网 络 领域 的 学 生 有 什么 建议 吗 ? 

网 络 沟通 了 多 个 学 科 。 它 源 于 电子 工程 和 计算 机 科学 、 运 和 药学、 经济 学 和 其 他 学 科 的 所 有 方面 。 估 
此 ， 网 络 研究 者 必须 熟悉 除了 协议 和 路 由 选择 算法 以 外 的 主题 。 

既然 网 络 已 经 成 为 日 常生 活 中 如 此 重要 的 一 部 分 ， 要 在 该 领域 标新立异 的 学 生 们 应 当 思 考 网 络 中 新 
的 资源 限制 : 人 的 时 间 及 努力 ， 而 不 只 是 囊 宽 或 存储 。 

从 事 网 络 研 究 工 作 能 够 给 人 以 极 大 的 满足 ， 因 为 它 使 得 人 们 能 够 相互 通信 和 交换 思想 ， 这 是 人 类 所 
必需 的 。 因 特 网 服务 提供 商 已 经 成 为 第 三 大 全 球 性 基础 设施 ， 接 近 于 运输 系统 和 能 源 分 配 ， 经 济 领 域 几 
乎 没有 哪个 部 分 离开 高 性 能 网 络 还 能 正常 运转 ， 由 此 对 可 预测 的 将 来 应 当 有 大 量 机 会 。 
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计算 机 网 络 中 的 安全 





早 在 1.6 节 我 们 就 撒 述 了 某 些 非 尝 盛行 和 危 辽 的 因特网 攻击 ， 包 括 普 意 软件 攻击 、 丰 
绝 服务 IRR, WARIRI SCE CR, 尽管 我 们 已 经 学 习 了 有关 计 算 机 网 络 的 大 量 
知识 ， 但 我 们 仍然 没有 考察 如 何 使 网 络 安全 ， 使 其 免 受 嘟 些 攻击 的 威胁 。 在 获得 了 新 的 计 
算 机 网 络 和 因特网 协议 的 专业 知识 后 ， 我 们 现在 将 深入 学 习 安 全 通信 ， 特 别 是 计算 机 网 络 
能 够 防御 那些 邻 人 厌 晋 的 坏 家 伙 的 原理 

我 们 首先 介绍 一 下 Alice 和 Bob， 这 俩 人 要 进行 通信 ， 并 希望 该 通信 过 程 是 “安全 ” 
的 。 由 于 本 书 是 一 本 网 络 教科 书 ， 因 此 Alice 和 Bob 可 以 是 两 台 需 要 安全 地 交换 路 由 选 拌 
表 的 路 由 天， 也 可 以 是 希望 建立 一 个 安全 传输 连接 的 客户 和 服务 各 ， 或 者 是 黄 个 交换 安全 
电子 邮件 的 电子 邮件 应 用 程序 ， 所 有 这 些 学 习 案 例 都 是 在 本 昔 后 面 我 们 要 考虑 的 。 总 之 ， 
Alice 和 Bob 是 安全 领域 中 的 两 个 众所周知 的 固定 设备 ， 也 许 因 为 使 用 Alice 和 Bob 更 为 有 
趣 ， 这 与 命名 为 “A” 的 普通 实体 需要 安全 地 与 命名 为 “B” 的 普通 实体 进行 通信 的 作用 
是 一 样 的 。 需 要 安全 通信 的 例子 通常 包括 不 正当 的 情人 关系 、 战 时 通信 和 商业 事务 往来 ; 
我 们 宁愿 用 第 一 个 例子 而 不 用 后 两 个 例子 ， 并 乐于 使 用 Alice 和 Bob 作为 我 们 的 发 送 方 和 
接收 方 ， 并 以 第 一 种 情况 为 背 尺 来 讨论 问题 。 

我 们 说 过 Alice 和 Bob 要 进行 通信 并 和布 望 做 到 “安全 ”， 那 么 此 处 的 安全 其 傅 切 含义 是 
什么 呢 ? 如 我 们 将 看 到 的 那样 ， 安 全 性 ( 像 爱 一 样 ) 是 多 姿 多 彩 的 东 册 ; 也 就 是 说 ， 安 全 
性 有 许多 方面 。 坚 无 疑问 ，Alice 和 Bob 希望 他 们 之 间 的 通信 内 容 对 于 人 急 听 者 是 保密 的 ， 
他 们 可 能 也 想 要 确保 当 他 们 需要 进行 通信 时 ， 确 实 是 在 和 对 方 在 通信 ， 还 硕 望 如 和 朱 他 们 之 
间 的 通信 被 急 听 者 自 改 时 ， 他 们 能 够 检测 到 该 通信 已 被 这 种 算 改 破坏 .在 本 草 的 第 一 部 
分 ， 我 们 将 讨论 能 够 加 密 通信 的 密码 技术 ， 鉴 别 正在 与 他 通信 的 对 方 并 确保 报 文 完整 性 。 

在 本 章 的 第 二 部 分 ， 我 们 将 研究 基本 的 密码 学 原则 怎样 能 够 被 用 于 生成 安全 的 网 络 协 
议 。 我 们 再 次 采用 目 顶 回 下 方法 ， 从 应 用 层 开 始 ， 将 逐 层 (上面 四 层 ) 研究 安全 协议 。 我 
们 将 研究 如 何 加 密 电 子 邮 件 ， 如 何 加 密 一 条 TCP 连接 ， 如 何在 网 络 层 提 供 覆 新 式 安全 性 ， 
以 及 如 何 使 无 线 LAN 安全 。 在 本 章 的 第 三 部 分 ， 我们 将 考虑 运行 的 安全 性 ， 这 与 保护 机 
构 网 络 免 受 攻 击 有 关 。 特 别 是 ， 我 们 将 仔细 观察 防火 墙 和 入 侵 检 测 系 统 是 怎样 加 强 机 构 网 
络 的 安全 性 的 。 


8.1 什么 是 网 络 安全 


我 们 还 是 以 要 进行 “安全 ”通信 的 情人 Alice 和 Bob 为 例 ， 开 始 我 们 的 网 络 安 全 的 研 
究 。 这 确切 地 意味 着 什么 呢 ? 显然 ，Alice 希望 即使 他 们 在 一 个 不 安全 的 媒体 上 进行 通信 ， 
也 只 有 Bob 能 够 理解 她 所 发 送 的 报 文 ， 其 中 入 侵 者 (入侵 者 名 叫 Trudy) 能 够 在 该 媒体 上 
截获 从 Alice 向 Bob 传输 的 报 文 。Bob 也 需要 确保 从 Alice 接收 到 的 报 文 确实 是 由 Alice 所 
Rik, FFA Alice 要 确保 和 她 进行 通信 的 人 的 确 就 是 Bob. Alice 和 Bob 还 要 确保 他 们 报 文 
的 内 容 在 传输 过 程 中 没有 被 自 改 。 他 们 育 先 也 要 确信 他 们 能 够 通信 〈 即 无 人 能 够 拒绝 他 们 
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+ 
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fe AGH (a ir AY St). ZIE T aE, RIE ih SR (secure communication ) 
有 具有 下 列 所 需要 的 特性 
e 机 密 性 (confidentiality ) 。 仅 有 发 送 方 和 和 硕 望 的 接收 方 能 够 理解 传输 报 文 的 内 容 . 
因为 宵 听 者 可 以 规 获 报 文 ， 这 必须 要 求 报 文 在 一 定 程度 上 进行 加 密 (encrypted), 
使 截取 的 报 文 无 法 被 截获 者 所 理解 。 机 和 密 性 的 这 个 方面 大 概 就 是 通常 意义 上 对 于 
术语 安全 通信 的 理解 。 我 们 将 在 8. 2 节 中 学 习 数 据 加 密 和 解密 的 密码 学 技术 ， 
o 报 文 完整 性 (message integrity). Alice 和 Bob 希望 确保 其 通信 的 内 容 在 传输 过 程 
中 未 被 改变 一 一 或 者 恶意 算 改 或 者 意外 改动 ， 我们 在 可 徘 传 输 和 数据 链 路 协议 中 
过 到 的 检验 和 技术 在 扩展 后 能 够 用 于 提供 这 种 报 文 完整 性 ， 我 们 将 在 8.3 节 中 研 
究 该 主题 ， 
e 端点 鉴别 (end-point authentication ) 。 发 送 方 和 接收 方 都 应 该 能 证 实 通信 过 程 所 涉 
及 的 另 一 方 ， 以 确信 通信 的 另 一 方 确实 具有 他 们 所 声称 的 身份 。 人 类 的 面对面 通信 
可 以 通过 视觉 识别 轻易 地 解决 这 个 问题 。 当 通信 实体 在 不 能 看 到 对 方 的 媒体 上 交换 





报 文 时 ， 鉴 别 就 不 是 那么 简单 了 。 当 某 用 户 要 访问 一 个 邮箱 ， 邮 件 服务 闫 如 何 证 实 
该 用 户 就 是 他 或 她 所 声称 的 那个 人 呢 ? 我 们 将 在 8.4 节 中 和 学习 端点 鉴别 技术 。 


© 运行 安全 性 (operational security), 几乎 所 有 的 机 构 (公司 、 大 学 等 ) 今天 都 有 了 
与 公共 因特网 相连 接 的 网 络 。 这 些 网 络 都 因此 潜在 地 能 够 被 危及 安全 。 攻 击 者 能 
够 试图 在 网 络 主机 中 安放 蠕虫 ， 获 取 公 司 秘密 ,勘察 内 部 网 络 配 置 并 发 起 DoS 攻 
击 。 我 们 将 在 8.9 节 中 看 到 诸如 防火 墙 和 入 侵 检 测 系统 等 运行 设备 正 被 用 于 反 制 
对 机 构 网 络 的 攻击 。 防 火 墙 位 于 机 构 网 络 和 公共 网 络 之 间 ， 控 制 接 人 和 来 自 网 络 
的 分 组 。 入侵 检 测 系统 执行 “深度 分 组 检查 ”任务 ， 加 网 络 管理 员 发 出 有 关 可 疑 
活动 的 警告 ， 
明确 了 我 们 所 指 的 网 络 安全 的 具体 含义 后 ， 我 们 接 下 来 考虑 人 侵 者 可 能 要 访问 的 到 底 
是 哪些 信息 ， 以 及 入 侵 者 可 能 采取 哪些 行动 。 图 8-1 阐述 了 一 种 情况 。Alice (发 送 方 ) 想 
要 发 送 数 据 给 Bob (接收 方 ) 。 为 了 安全 地 交换 数据 ， 即 在 满足 机 密 性 、 端 点 鉴别 和 报 文 
完整 性 要 求 的 情况 下 ，Alice 和 Bob 将 交换 控制 报 文 和 数据 报 文 (以 非常 类 似 于 TCP 发 送 
方 和 接收 方 双 方 交 换 控 制 报 文 和 数据 报 文 的 方式 进行 )。 通 第 将 这 些 报 文 全 部 或 部 分 加 密 。 
如 在 1.6 市 所 讨论 的 那样 ， 入 侵 者 能 够 潜在 地 执行 下 列 行为 : 
e 窃听 一 一 监听 并 记录 信道 上 传输 的 控制 报 文 和 数据 报 文 。 
© 修改 、 插 入 或 删除 报 文 或 报 文 内 容 。 





控制 、 数 据 报 文 





Trudy 


图 8-1 发 送 方 、 接 收 方 和 入 侵 者 (Alice, Bob 和 Trudy ) 


tt HMMA PARE 443 


如 我 们 将 看 到 的 那样 ， 除 非 采取 适当 的 措施 ， 和 否则 上 述 能 力 使 人 侵 者 可 以 用 多 种 方式 
发 动 各 种 各 样 的 安全 攻击 : 家 听 通信 内 容 (可 能 神 取 口令 和 数据 ) ， 假 胃 另 一 个 实体 ， 
“劫持 ”一 个 正在 进行 的 会 话 ， 通 过 使 系统 资源 过 载 拒 绝 合法 网 络 用 户 的 服务 请 求 等 等 。 
CERT 协调 中 心 对 已 报道 的 攻击 进行 了 总 结 | CERT 2012 | . 

已 经 知道 在 因特网 中 茶 处 的 确 和 存在 中 实 的 威胁 ， 则 Alice 和 Bob (我 们 的 两 个 笛 要 安 
全 通信 的 朋友 ) 在 因特网 上 的 对 应 实体 是 什么 呢 ? 当然 ，Alice 和 Bob 可 以 是 位 于 两 个 端 
系统 的 人 类 用 户 ， 例 如， 真实 的 Alice 和 真实 的 Bob 真 的 需要 交换 安全 电子 邮件 。 他 们 也 
可 以 参与 电子 疝 务 事务 例如， 一 个 只 实 的 Bob 和 希望 安全 地 回 一 台 Web 服务 硕 传 输 他 的 
信用 卡号 码 ， 以 在 线 购 买 商 品 。 类 似 地 ， 真 实 的 Alice 要 与 银行 在 线 交 互 。 需要 安全 通信 
的 各 方 和 月 号 也 可 能 是 网 络 基础 设 ee bin 进 过 ， 域 名 系统 (DNS, Bl 2.5 4) 
或 交换 路 由 选择 信息 的 路 由 选择 守护 程序 (参见 4.6 市 ) 击 要 在 两 方 之 间 安 全 通信 对 于 
网 络 管理 应 用 也 有 相同 的 情况 ， etme 习 的 主题 。 能 主动 干扰 DNS 查找 和 更 
新 (如 在 2.5 世 中 讨论 的 那样 ) 、 路 由 选择 计算 [RFC 4272 | 或 网 络 管 理 功 能 | REC 
3414] 的 入 侵 者 能 够 给 因特网 造成 不 可 估量 的 破坏 。. 

建立 了 上 述 框架 ， 明 确 了 一 些 重要 定义 以 及 网 络 安全 需求 之 后 ， 我 们 将 深入 学 习 密 但 
Fo pp :来 提供 机 密 性 是 不 言 而 喻 的 ， 同 时 我 们 很 快 将 看 到 它 对 于 提供 ag BA BE 
报 文 完整 性 也 起 到 了 核心 作用 ， 这 使 得 密码 学 成 为 网 络 安全 的 基石 。 


8.2 密码 学 的 原则 


尽管 密码 学 的 漫长 历史 可 以 追溯 到 朱利叶 斯 < 凯撒 (Julius Caesar) 时 代 ， 但 现代 密 
RER (包括 正在 今天 的 因特网 中 应 用 的 许多 拉 术 ) 基于 的 是 过 去 30 年 所 取得 的 进展 
Kahn 的 著作 《破译 者 (The Codebreakers)》( | Kahn 1967| AI Singh 的 著作 《编码 技术 : 
保密 的 科学 一 一 从 而 埃及 到 量子 密码 (The Code Book: The Science of Secrecy from Ancient 
Egypt to Quantum Cryptography)》 | Singh 1999 | 回顾 了 引人入胜 的 密 合 学 的 修 信 历史 。 对 
密码 学 全 面 的 讨论 需要 一 本 完整 的 书 | Kaufman 1995; Schneier 1995 | ， 所 以 我 们 只 能 初步 
了 解密 人 码 学 的 基本 方面 ， 特 别 是 因为 这 些 东 西 正在 今天 的 因特网 上 发 挥 人 作用。 我们 也 注意 
到 尽管 本 节 的 重点 是 密码 学 在 机 密 性 方面 的 应 用 ,但 我 们 将 很 快 看 到 密码 学 技术 与 鉴别 、 
报 文 完整 性 和 不 可 否认 性 等 是 紧密 相关 的 ， 

密码 技术 使 得 发 送 方 可 以 伪装 数据 ， 使 入 侵 者 不 能 从 截取 到 的 数据 中 获得 任何 信 
号 。 当 然 ， 接 收 方 必 须 能 够 从 伪 流 的 数据 中 恢复 出 初始 数据 。 图 8-2 说 明了 一 些 重 要 的 
术语 。 

现在 假设 Alice 要 问 Bob 发 送 一 个 报 文 。Alice RUM RPE (flan, “Bob, I love 
you. Alice”) ERARA (plaintext, cleartext). Alice 使 用 加 密 算法 (encryption algorithm ) 
加 密 其 明文 报 文 ， 生 成 的 加 密 报 文 被 称 为 密 文 ( ciphertext)， 该 密 文 对 任何 入 侵 者 看 起 来 
是 不 可 懂 的 。 有 趣 的 是 在 许多 现代 密码 系统 中 ， 包 括 因 特 网 上 所 使 用 的 那些 ， 加 密 技术 本 
身 是 已 知 的 ， 即 公开 发 行 的 、 标 准 化 的 和 任何 人 都 可 使 用 的 (例如 | RFC 1321; RFC 
3447; RFC 2420; NIST 2001 | ) ， 即 使 对 潜在 的 入 侵 者 也 是 如 此 ! 显然 ， 如 果 任 何人 都 知 
道 数据 编码 的 方法 ， 则 一 定 有 一 些 秘密 信息 可 以 阻止 入侵 者 解密 被 传输 的 数据 。 这 些 秘密 
信息 就 是 密 铀 . 
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图 8-2 密码 学 组 成 部 分 


在 图 8-2 中 ，Alice 提供 了 一 个 密 钥 (key) K,， 它 是 一 串 数 字 或 字符 ， 作 为 加 密 算法 的 
输入 。 加 密 算 法 以 密 钥 和 明文 报 文 m 为 输入 ， 生 成 的 密 文 作为 输出 。 用 符号 Ky, (m) 表示 
(EHRE K, 加 密 的 ) 明文 报 文 m 的 密 文 形式 。 使 用 密 钥 K, 的 实际 加 密 算 法 显然 与 上 下 文 
有 关 。 类 似 地 ，Bob 将 为 解密 算法 (decryption algorithm) 提供 密 钥 kK,,， 将 密 文 和 Bob 的 密 
钥 作 为 输入 ， 输 出 初始 明文 .也 就 是 说 ， 如 果 Bob 接收 到 一 个 加 密 的 报 文 K(m)， 他 可 通过 
计算 K,(K,(m)) = 六 进行 解密 。 在 对 称 密 钥 系统 (symmetric key system) 中 ，Alice 和 Bob 
的 密 钥 是 相同 的 并 且 是 秘密 的 ， 在 公开 密 钥 系统 (public key system) 中 ， 使 用 一 对 密 钥 : 一 
个 密 钥 为 Bob 和 Alice 俩 人 所 知 (实际 上 为 全 世界 所 知 )， 男 一 个 密 钥 只 有 Bob ak Alice 知道 
(而 不 是 双方 都 知道 )， 在 下 面 两 小 节 中 ， 我 们 将 更 为 详细 地 考虑 对 称 密 钥 系统 和 公 钥 系统 ， 


8.2.1 对 称 密 钥 密码 体制 


所 有 密码 算法 部 涉及 用 一 种 东西 替换 另 一 种 东西 的 思想 ， 例 如 ， 取 明文 的 一 部 分 进行 
计算 ， 替换 适当 的 密 文 以 生成 加 密 的 报 文 。 在 分 析 现 代 基 于 密 钥 的 密码 系统 之 前 ， 我 们 首 
先 学 习 一 下 凯撒 密码 (Caesar cipher) 找 找 感 觉 ， 这 是 一 种 加 密 数 据 的 方法 。 这 种 非常 古 
老 而 向 单 的 对 称 密 钥 算法 由 Julius Caesar 发 明 。 

凯撒 密码 用 于 英语 文本 时 ， 将 明文 报 文 中 的 每 个 字母 用 字母 表 中 该 字母 后 第 有 个 字母 
进行 替换 (允许 回 比 ， 即 把 字母 “a” 排 在 字母 “z” 之 后 ) 。 例 如 ， 如 果 左 =3， 则 明文 中 
的 字母 “a” 变 成 密 文中 的 字母 “d”; 明文 中 的 字母 “b” 变 成 密 文中 的 字母 “e”， 依 此 
类 推 。 因 此 ,的 值 就 作为 密 钥 。 举 一 个 例子 ， 明 文 报 文 “bob，i love you. alice” E% X 
中 变 成 “ere，l oryh brx. dolfh”。 尽 管 密 文 看 起 来 像 乱 码 ， 但 如 果 你 知道 使 用 了 弛 撤 密 码 
加 密 时 ， 因 为 密 钥 值 只 有 25 个 ， 所 以 用 不 了 多 久 就 可 以 破解 它 。 

引 撤 密码 的 一 种 改进 方法 是 单 码 代替 密码 ( monoalphabetic cipher)， 也 是 使 用 字母 表 中 
的 一 个 字母 蔡 换 该 字母 表 中 的 另 一 个 字母 。 然 而 ， 并 非 按照 规则 的 模式 进行 奉 换 〈 例 如 ， 明 
文中 的 所 有 字母 都 用 偶 移 量 为 上 的 字母 进行 奉 换 ) ， 只 要 每 个 字母 都 有 一 个 唯一 的 奉 换 字 蔷 ， 
任 一 字母 都 可 用 男 一 字母 替换 ， 反 之 亦 然 。 图 8-3 为 加 密 明 文 的 一 种 可 行 蔡 换 规则 。 


明文 字母 :a bc defghijxl1l 


Mnspqrstuvwx y z 
Buf mnbvexzasdfghjklpoiuytrewg 


图 8-3 FAAR Ea 
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明文 报 文 “bob，ilove you. alice” Æ “nkn, s gkte wky. mgsbc”。 因 此， 与 用 起 撤 密 
但 情况 一 样 ， 这 看 起 来 像 乱 全。 单 码 代 蔡 密码 的 性 能 看 来 要 比 凯 撤 密 码 的 好 得 多 ， 可 能 的 
字母 配对 为 261! (为 10 数量 级 ) ， 而 不 是 25 种 可 能 的 配对 。 尝 试 所 有 的 10 ”种 可 能 配对 
的 性 力 法 ， 其 要 求 的 工作 量 太 大 ,不 是 一 种 破解 加 密 算 法 和 解密 报 文 的 可 行 方式 。 但 是 ， 
通过 对 明文 语言 进行 统计 分 析 ， 例 如 ， 在 典型 的 瑞 语 文本 中 ， 由 于 已 知 字 要“e ”和 和 字 酉 
“t ”出 现 的 频率 最 高 (这 些 字 本 出 现 的 频率 分 别 为 13% 和 9% ) , AT A Ae UL = = 
母 的 组 合 通常 一 起 出 现 〈 例 如 ,“in”“it” “the”, “ion”, “ing” 等 等 ) ， 这 就 使 得 破解 
该 窗 文 变 得 相对 容易 ，。 如 果 入 侵 者 具有 某 些 该 报 文 的 可 能 内 容 的 知识 ， 则 破解 该 密 公 就 会 
更 为 容易 、 例 如 ， 如 果 入 侵 者 Trudy 是 Bob 的 妻子 ,怀疑 Bob 和 Alice 有 了 暧昧 关系 ， 则 她 
可 能 猜想 “bob” 和 “alice” 这 些 名 字 可 能 会 出 现在 密 文 中 。 如 果 Trudy 确信 这 两 个 名 字 
出 现在 密 文 中 ， 并 有 了 上述 报 文 的 密 文 副本 ， 她 则 能 够 立即 决定 这 26 个 字母 配对 中 的 7 
个 ， 比 蛮 力 法 少 检查 10” 种 可 能 性 。 如 果 Trudy 的 确 怀疑 Bob 有 不 正当 的 男女 关系 ， 她 可 
溪 也 非常 期 每 从 该 报 文 中 找到 菜 些 其 他 选择 的 词汇 。 

当 考 虑 Trudy 破解 Bob 和 Alice 之 间 加 密 方案 的 难 易 程度 时 ， 可 以 根据 入 侵 者 所 拥有 
的 信息 区 分 三 种 不 同 的 情况 。 

o 唯 客 文 攻击 。 有 些 情 况 下 ， 入 侵 者 只 能 得 到 截取 的 密 文 ， 也 不 了 解 明文 报 文 的 内 容 。 
我 们 已 经 看 到 ， 统 计 分 析 有 助 于 对 加 密 方 案 的 唯 密 文 攻击 ( ciphertext-only attack ) 。 

。 已 知 明文 攻 去 。 前面 已 经 看 到 ， 如 果 Trudy 以 某 种 方式 确信 在 密 文 报 文中 会 出 现 
“hob” 和 “alice”， 她 就 可 以 确定 字母 a、1、i、c、e、b Alo iy (WK, BX) 
匹配 关系 。Trudy 也 可 能 会 幸运 地 记录 到 传输 的 所 有 密 文 ， 然 后 在 一 张 纸 上 找到 
Bob 写 下 的 已 解密 的 明文 。 当 人 侵 者 知道 (明文 ， 密 文 ) 的 一 些 匹 配 时 ， 我们 将 
其 称 之 为 对 加 密 方 案 的 已 知 了 明文 攻击 (known- plaintext attack ) 。 

e 选择 明文 攻击 。 在 选择 明文 攻击 (chosen- plaintext attack) 中 ， 和 人 入侵 者 能 够 选择 基 
一 明文 报 文 并 得 到 该 明文 报 文 对 应 的 密 文 形式 。 对 于 我 们 前 面 所 说 的 简单 加 冤 算 
法 来 说 ， 如 果 Trudy 能 让 Alice 发 送 报 文 “The quick brown fox jumps over the lazy 
dog,”， 则 Trudy 就 能 够 完全 破解 Alice 和 Bob 所 使 用 的 加 密 方案 。 但 是 随后 我 们 
将 看 到 ， 对 于 更 为 复杂 的 加 密 技 术 来 说 ,使 用 选择 明文 攻击 不 一 定 意味 着 能 够 攻 
破 该 加 密 机 制 。 

500 年 前 ， 发 明了 多 码 人 代替 密码 (polyalphabetic encryption) ， 这 种 技术 是 对 单 码 代替 
密码 的 改进 .多 人 码 代 符 密 码 的 基本 思想 是 使 用 多 个 单 码 代替 密码 ， 一 个 单 码 代 蔡 密码 用 于 
加 密 东 明文 报 文中 一 个 特定 位 置 的 一 个 字母 。 因 此 ， 在 东明 文 报 文中 不 同位 置 出 现 的 相同 
字 娃 可 能 以 不 同 的 方式 编码 。 几 8-4 中 显示 了 多 人 码 代 蔡 和 窜 人 码 机 制 的 一 个 例子 。 它 使 用 两 个 
Lis (其 中 =5 和 不 =19)， 如 图 中 不 同 的 行 所 示 。 我 们 可 以 选择 使 用 这 两 个 凯撒 密 
fC, 和 C,， 加 密 时 采用 以 C,，C,;，C,，C,，C, 的 次 序 循环 的 模式 即 明 文 的 第 一 个 字母 用 
C 加密， 第 二 和 第 三 个 字母 用 C, 编码 ， 第 四 个 字母 使 用 C, ， 第 五 个 字母 用 C, ， 然 后 循环 
重复 该 模式 ， 即 第 六 个 字母 用 C 加 密 ， 第 七 个 字母 用 C, 加 密 ， 依 此 类 推 。 这 样 一 来 ， 明 
文 报 文 “bob，i love you. ”加 密 后 成 为 “ghu，n etox dhz. ”。 注 意 到 明文 报 文中 的 第 一 个 
“b” ALC, INRA “g”, BZA “b” WCG 加 密 为 “u”。 在 这 个 例子 中 ， 加 密 和 解密 
“ 密 钥 ”是 两 个 凯撒 密码 密 钥 (k=5 和 =19) AG, G, G, C, G 的 次 序 模式 的 
AiR. 
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朋 文 字母 : abcdefghigjgkimnopqarstuvwxya2z 
C, Ce=5) Eghijkimnopqrstuvwxyzabcde 
C (El st avwxeyzgwabedefghigjgkimnepgr:s 


图 8-4 (ERAI RCR ZAREE 


1. Hn, 

FR ATT EW ALBEE R Se PO, FRERE INR SO CTET. HE BS AS 47 
两 种 宽泛 的 类 型 : 流 密码 (stream ciphers ) ) WR (block ciphers). “4 4 ff] FEIER 
LAN 的 安全 性 时 ， 将 在 8.7 ay ee a) CEA, RIRIKI, IY 
用 于 多 种 因特网 协议 的 加 密 ! i 包括 PGP (用 于 安全 电 于 邮件 ) 、SSL (用 于 使 TCP 连接 
更 安全 ) 和 [IPsec (用 寺 使 网 络 层 传输 更 安全 )， 

在 块 密码 中 ， 要 可 密 的 报 文 被 处 理 为 比特 的 块 。 例 如 ， 如 果 上 =64， 则 报 文 被 划分 
为 64 比特 的 块 ， 每 块 被 独立 加 密 。 为 了 加 密 一 个 块 ， 该 密码 灯 几 了 一 对 一 映 冉 将 上 比 
特 块 的 明文 映射 为 比特 块 的 密 文 ， 我 们 来 看 一 个 例子 。 假设 =3， 因 此 块 密码 将 3 比特 
输入 (明文 ) 映射 为 3 比特 输出 〈 密 文 ) 。 表 8-1 给 出 了 了 一 种 可 能 的 映射 ， 注 意 到 这 是 一 
个 一 对 一 的 映射 ， 即 对 每 种 输入 有 不 同 的 输出 。 这 种 块 密码 将 报 文 划分 成 3 比特 的 块 并 想 
据 映 射 美 系 进行 加 密 。 可 以 验证 ， 报 文 010110001111 被 加 窗 成 了 101000111001. 


表 8-1 一 种 特定 的 3 比特 块 密码 





输入 输出 EZS 输出 
000 110 100 | O11 








EEE 


001 Ili 101 O10 
4 O10 101 110 000 
011 100 11] 001 


继续 这 个 3 比特 块 的 例子 ,注意 到 上 述 映射 只 是 许多 可 能 映射 中 的 一 种 ， 有 多 少 种 可 
能 的 映射 呢 ?” 要 回答 这 个 问题 ， 观 察 到 一 个 映 冉 只 不 过 是 所 有 可 能 输入 的 排列 。 共 有 
2 ( =8) 种 可 能 的 输入 (排列 在 “输入 ” 栏 中 ) ”这 8 种 输入 能 够 排列 为 8! =40 320 种 不 
同方 式 ， 因 为 这 些 排列 的 每 种 都 定义 了 一 种 映射 ， 共 有 40 320 种 串 能 的 上 映射。 我们 能 够 将 
这 些 映 射 的 每 种 视 为 一 个 密 钥 ， 即 如 果 Alice 和 Bob 都 知道 该 映射 (H), ， 他 们 能 够 加 密 
和 解密 在 他 们 之 间 发 送 的 报 文 。 

对 这 种 密码 的 蛮 力 攻击 即 通 过 使 用 所 有 了 上 映射 来 尝试 解密 密 文 。 仅 使 用 40 320 种 映射 
( 当 上 =3)， 这 能 够 在 一 台 桌 面 PC 上 迅速 完成 。 为 了 挫败 蛮 力 攻击 ， 块 密码 通 负 使 用 大 得 
多 的 块 ， 由 64 比特 甚至 更 多 比特 组 成 .注意 到 对 于 通 稼 的 大 比特 块 密 合 ， 可 能 映射 数 最 
是 2 1!， 对 于 即使 不 大 的 上 值 (如 大 =64)， 这 也 是 一 个 天 文 数 字 。， 

如 刚才 所 述 ， 尽 管 全 表 块 密码 对 于 不 大 的 大 值 能 够 产生 健壮 的 对 称 密 钥 加 窗 方 案 ， 但 
不 幸 的 是 它们 难以 实现 。 对 于 上 =64 和 给 定 的 映射 ， 将 要 求 Alice 和 Bob 维护 一 张 具有 2” 
个 输入 值 的 表 ， 这 是 一 个 难以 实现 的 任务 。 此外， 如 果 Alice 和 Bob 要 改变 密 钥 ， 他 们 将 
不 得 不 每 人 重新 生成 该 表 。 因 此， 全 表 块 密码 在 所 有 输入 和 输出 之 间 提 供 了 预先 决定 的 映 
射 〈 如 在 上 述 例 子 中 那样 ) ， 这 简直 是 不 可 能 实现 的 事 。 

取而代之 的 是 ， 块 密码 通 笛 使 用 因数 模拟 随机 排列 表 ， 在 图 8-5 中 显示 了 了 当 上 大 =64 时 
这 种 晒 数 的 一 个 例 ( 引 自 | Kaufman 1995 ] ) Rem Boe EH 64 比特 块 划分 为 8 个 块 ， 
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每 个 块 由 8 比特 组 成 。 每 个 8 比特 块 由 一 个 “8 比特 到 8 比特 ” 表 处 理 ， 这 是 个 可 管理 的 
长 度 。 例 如 ， 第 一 个 块 由 标志 为 了 的 表 来 处 理 , 接 下 来 ， 这 8 个 输出 块 被 重新 冯 配 成 一 
个 64 比特 的 块 。 该 输出 被 回馈 到 64 比特 的 输入 ， 开 始 了 第 二 次 循环 . Zt n WIEN TAD 
后 ， 该 限 数 提供 了 一 个 64 比特 的 密 文 块 。 这 种 循环 的 日 的 是 使 得 每 个 输入 比特 影响 最 后 
输出 比特 的 大 部 分 ( 即使 不 是 全 部 )。( 如 果 仅 使 用 一 次 循环 ， 一 个 给 定 的 输入 比特 将 仅 
影响 64 输出 比特 中 的 8 比特 ,) 这 种 块 密码 算法 的 密 钥 将 是 8 张 排列 表 (BE E AL PR KGE 
公共 已 知 的 ) 。 

目前 有 一 些 流 行 的 块 密 合 ， 包 括 DES (Data Encryption Standard， 数 据 加 密 标 准 ) 、 
3DES 和 AES (Advanced Encryption Standard ， 高 级 加 密 标 准 ) . 这些 标准 中 的 每 种 都 使 用 
负数 (而 不 是 预先 决定 的 表 ) ， 连 同 图 8-5 的 线 (虽然 对 每 种 密码 来 说 更 为 复杂 和 具 
体 )， 这 些 算法 中 的 每 种 也 使 用 了 比特 串 作为 密 钥 。 例 如 ，DES 使 用 了 具有 56 比特 密 钥 的 
64 比特 块 。AES 使 用 128 比特 块 ， 能 够 使 用 128 、192 和 256 比特 长 的 密 钥 进行 操作 。 一 
个 算法 的 密 钥 决定 了 特定 “小 型 表 ” 上 映射 和 该 算法 内 部 的 排列 。 对 这 些 密 公 中 的 每 种 进行 
明 力 攻击 要 循环 通过 所 有 帘 钥 ， 用 每 个 窗 钥 应 用 解密 算法 。 观 察 到 采用 长 度 为 n 的 密 钥 ， 
有 2" 种 可 能 的 密 钥 。NIST [ NIST 2001 | 估计 ， 如 果 用 1 秒 钟 破解 56 比特 DES 的 计算 机 
(就 是 说 ， 每 秒 钟 尝试 所 有 2” 个 密 钥 ) 来 破解 一 个 128 比特 的 AES 密 钥 ， 要 用 大 约 149 万 
亿 年 的 时 间 才 有 可 能 成 功 。 
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图 8-5 一 个 块 密码 的 例子 





2. 密码 块 链 接 

在 计算 机 网 络 应 用 中 ， 我 们 通常 需要 加 密 长 报 文 (或 长 数据 流 )。 如 来 我 们 使 用 前 面 
描述 的 块 密码 ， 通 过 和 耳 接 将 报 文 切割 成 比特 块 并 独立 地 加 密 每 块 ， 将 出 现 一 个 微妙 而 重 
要 的 问题 。 为 了 理解 这 个 问题 ， 注 意 到 两 个 或 更 多 个 明文 块 可 能 是 相同 的 ， 例 如 ， 两 个 或 
更 多 块 中 的 明文 可 能 是 “HTTPZ1. 1 ”。 对 于 这 些 相 同 的 块 ， 块 密码 当然 将 产生 相同 的 密 
文 。 当 攻击 者 看 到 相同 的 密 文 块 时 ， 它 可 能 淤 在 地 猜 出 其 明文 ， 并 且 通 过 识别 相同 的 密 文 
块 和 利用 文 返 协 以 结构 的 知识 ， 甚 至 能 够 解密 整个 报 文 [Kaufman 1995 | 。 


为 了 解决 这 个 问题 ， 我 们 能 够 在 密 文中 混合 东 些 随机 性 ， 使 得 相同 的 明文 块 产 生 不 同 
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的 密 文 块 . 为 了 解释 这 个 想法 , S mi) 表示 第 i 个 明文 块 ，c(i) Fem BT PIR, IF 
H.a 了 Bb 表示 两 个 比特 串 a Alb A Seek (XOR). CH OOO=101=0 MOO! = 
1 中 0 =1, 谋 且 两 个 比特 串 的 异 或 是 逐 位 进行 的 。 因此 有 ， 例 如 10101010 由 11110000 = 
01011010.) Fab, EAA BA S oe e a , 其 基本 思想 如 下 : 发 送 方 
为 第 i 块 生成 一 个 随机 的 比特 数 r(7) ， 并 且 计 算 c(i) = 人 (mm(i) 电 7(i) )， 注意 到 每 块 选 
择 一 个 新 的 比特 随机 数 。 则 发 送 方 发 送 <(1) 、r(1) 、c(2) 、r(2) 、c(3) 和 r(3) 等 等 
因为 接收 方 接收 到 ec( 和 rr(i)， 它 能 够 通过 计算 m(i) = Ky(e(i) ® r(i)) 而 恢复 每 个 明 
文 块 . 重要 的 是 注意 到 下 列 事实 : 尽管 r(i) 是 以 明文 发 送 的 ,并且 因此 能 被 Trudy INFR 
到 ， 但 她 无 法 获得 明文 m(i) ， 因 为 她 不 知道 密 钥 KK;。 同 时 注意 到 如 果 两 个 明文 块 m(i) 和 
m(j) 是 相同 的 ， 对 应 的 密 文 块 (i) 和 ec) 将 是 不 同 的 (只 要 随机 数 r(i) 和 r( 丫 不同 ， 
这 种 情况 出 现 的 概率 将 很 高 ) 

举例 来 说 ， 考 虑 在 表 8-1 中 的 3 比特 块 密码 。 假 设 明 文 是 010010010,。， 如 果 Alice 直接 
对 此 加 密 ， 没 有 包括 随机 性 ， 得 到 的 密 文 变 为 101101101 如 果 Trudy 嗅 探 到 该 密 文 ， 因 
NATE 文 块 的 每 个 都 是 相同 的 ， 好 能 够 正确 地 推断 出 这 三 个 明文 块 的 每 个 部 古 相 同 
的 。 现 在 假设 Alice 产生 了 随机 块 r(1) =001、r(2) =111 和 r(3) =100, 并 且 使 用 了 上 述 
技术 来 生成 密 文 <(1) =100、c(2) =010 和 ce(3) =000。 注 意 到 即使 明文 块 相 同 ， 三 个 密 
不同 的 。Alice 则 发 送 (1)、r(1)、c(2) 和 7(2)。 读者 可 证 实 Bob 能 够 使 用 共 
AN Me Ks 获得 初始 的 明文 

机 敏 的 读者 将 注意 到 ， 引 入 随机 性 解决 了 一 个 问题 而 产生 了 了 另 一 个 问题 : Alice 必 
须 传 输 是 以 前 两 倍 的 比特 。 实际 上 上 ， 对 每 个 加 密 比 特 ， 她 现在 必须 再 发 送 一 个 随机 比 
竺 ， 使 而 要 的 寓 宽 加 倍 。 为 了 有 效 利用 该 技术 ， 块 密码 通 贡 使 用 了 一 种 称 为 密码 块 链接 
(Cipher Block Chaining, CBC) 的 技术 。 其 基本 思想 是 仅 随 第 一 个 报 文 发 
然后 让 发 送 方 和 接收 方 使 用 计算 的 编码 块 代替 后 继 的 随机 数 . 具体 而 言 ，CBC 运行 过 程 
WF: 

L) 在 加 密 报 文 (或 数据 流 ) 之 前 ， 发 ; ea, ieee kR, PR AHS i) 


(Initialization Vector, IV). 将 该 初始 向 量 表示 为 c(0) 。 发 送 方 以 明文 方式 将 IV 发 送 给 接 
WOR. 
2) 对 第 一 个 块 ， 发 送 方 计算 m(1) 电 c(0)， 即 计算 第 一 块 明文 与 IV 的 异 或 。 然 后 通 


过 块 密码 算法 运行 得 到 的 结果 以 得 到 对 应 的 窗 veh Bhe(1) =Ky(m(1)@®c(0). REA 
er] PWC Ty Ae VE INH c(1)， 

3) 对 于 第 i 个 块 ， 发 送 方 根据 c(i) =K (mi) @® c(i-1) ERB i TELH, 

我 们 现在 来 考察 这 种 方法 的 某 些 后 果 。 首 先 ， 接 收 方 将 仍 能 够 恢复 初始 报 文 。 军 无 疑 
[i] , A AAT ENE (i), EM K, REZI) =m(i)Oe(i-1l); 因为 接收 方 已 
ZARE e(i-1), EWM m(i) =s(i)®celi-1) 获得 明文 块 。 第 二 ， 即 使 两 个 明文 块 定 相 
同 的 ， 相 应 的 密 : 文 块 将 ( 几乎 ) 总 是 不 同 的 。 第 三 ， 虽 然 发 送 方 以 明文 发 关 IV， 入 侵 者 
将 仍 不 能 解密 密 文 块 ， 因 为 该 入 侵 者 不 知道 秘密 密 钥 S。 最后， 发 送 方 仅 发 送 一 个 最 前 面 
的 块 ( 即 IV)， 因 此 对 (由 数 百 块 组 成 的 ) 长 报 文 而 言 增加 的 帝 宽 用 量 微 不足 这 ， 

举例 来 说 对 表 8-1 中 的 3 比特 块 密码 ， 明 文 为 010010010 和 ITV =c(0) =001， 我们 
现在 来 确定 其 密 文 . 发送 方 首 先 使 用 IV 来 计算 c(1) =Ky(m(1)@®e(0)) = 100, 发 送 方 然 
Rit® c(2) =K.(m(2)@c(1) =K,(010 @ 100) =000, FRH el3 =K mis D2) = 
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人 (010 ®© 000) =101, 读者 可 证 实 接收 方 硅 知 道 了 IV 和 人 人 ,， 将 能 够 恢复 初始 的 明文 
当 设 计 安 全 网 络 协议 时 ，CBC 有 一 种 重要 的 后 果 : 我 们 需要 在 协议 中 提供 一 种 机 制 ， 
以 从 发 送 方 回 接收 方 分 发 IV, 在 本 草 稍 后 我 们 将 看 到 几 个 协议 是 如 何 这 样 做 的 。 


8. 2.2 公开 密 钥 加 密 


WL ae HSI (GELB 20 世纪 70 年 代 的 两 千 多 年 以 来 ， 加 密 通 信和 都 击 要 通信 双方 共 
至 一 个 共同 秘密 ， 即 用 于 加 密 和 解密 的 对 称 密 钥 。 这 种 方法 的 一 个 肝 难 是 两 方 必须 就 共 
享 密 钥 达成 一 致 ; 但 是 这 样 做 的 前 提 是 需要 通信 (可 假定 是 安全 的 )! 可 能 是 双方 首先 
会 面 ， 人 为 协商 确定 密 钥 (例如 ， 虎 撤 的 两 个 百 夫 长 在 罗马 浴室 储 头 ) ， 此 后 才能 进行 
加 密 通 信 。 但 是 ， 在 网 络 址 界 中 ， 通 信 各 方 之 间 可 能 从 未 见 过 面 ， 也 不 会 在 网 络 以 外 的 
任何 地 方 交 谈 。 此 时 通信 双方 能 够 在 没有 预先 商定 的 共享 密 钥 的 条 件 下 进行 加 密 通 信 
Hy? 在 1976 年 ，Diffie Al Hellman | Diffie 1976] 论证 了 一 个 解决 这 个 问题 的 算法 (现在 
称 为 Diffie- Hellman 密 钥 交换 ) ， 这 是 个 完全 不 同 、 极 为 优雅 的 安全 通信 算法 ， 开 创 了 了 如 
今 的 公开 密 钥 密码 系统 的 发 展 之 路 。 我 们 很 快 就 会 看 到 公开 密 钥 密码 系统 也 有 许多 很 好 
的 特性 ， 使 得 它 不 仅 可 以 用 于 加 密 ， 还 可 以 用 于 鉴别 和 数字 和 签名。 有趣 的 是 ， 最 近 发 现 
20 世纪 70 年 代 早 期 由 英国 通信 和 电子 安全 团体 的 研究 人 员 独 立 研 究 的 一 系列 秘密 报告 中 
的 思想 ,与 [Diffie 1976] 和 [RSA 1978] 中 的 思想 类 似 [Ellis 1987]. 事实 常常 如 
此 ,伟大 的 想法 通常 会 在 许多 地 方 独 立地 办 现 ; 幸运 的 是 ， 公 钥 的 进展 不 仅 秘 密 地 发 
生 ， 而 且 也 在 公众 视野 中 发 生 

公开 密 钥 密码 的 使 用 在 概念 上 相当 简单 。 假 设 Alice 要 和 Bob 通信 。 如 图 8-6 所 示 ， 
这 时 Alice 和 Bob 并 未 共享 一 个 密 钥 ( 如 同 在 对 称 密 钥 系统 情况 下 )， 而 Bob (Alice 报 文 
的 接收 方 ) 则 有 两 个 密 钥 ， 一 个 是 世界 上 的 任何 人 (包括 入 侵 者 Trudy) 部 可 得 到 的 公 钠 
(public key ) ， 男 一 个 是 只 有 Bob 知道 的 私 钥 (private key) 。 我 们 使 用 符号 人 AIK, 来 分 
别 表 示 Bob 的 公 钥 和 私 钥 。 为 了 与 Bob 通信 ，Alice 首先 取得 Bob 的 公 铀 ， 然 后 用 这 个 公 
钥 和 一 个 众所周知 的 〈 例 如 ， 已 标准 化 的 ) 加 密 算 法 ， 加 密 她 要 传递 给 Bob 的 报 文 m; BI 
Alice 计算 Ki (m). Bob 接收 到 Alice 的 加 密 报 文 后 ， 用 其 私 钥 和 一 个 众所周知 的 (例如 ， 
已 标准 化 的 ) 解密 算法 解密 Alice 的 加 密 报 文 ， 即 Bob 计算 Ks (Ky (m))。 后 面 我 们 将 看 
到 ， 存 在 着 可 以 选择 公 钥 和 私 钥 的 加 密 / 解 密 算 法 和 技术 ， 使 得 Kr (Ks (m)) =m; 也 就 是 
说 ， 用 Bob 的 公 钥 Ay 加 密 报 文 m (得 到 Ks (m))， 然 后 再 用 Bob 的 私 钥 人 解密 报 文 的 
密 文 形式 〈 就 是 计算 Ks (Ks (m))) 就 能 得 到 最 初 的 明文 m。 这 是 个 不 寻 第 的 结果 ! 用 这 
种 办 法 ，Alice 可 以 使 用 Bob 公开 可 用 的 密 钥 给 Bob 发 送 机 密 信 息 ， 而 他 们 任 一 方 都 无 须 
分 发 任何 密 钥 ! 我 们 很 快 能 够 看 到 ， 公 和 钥 和 私 钥 加 密 相 互 交 换 同样 能 够 得 到 不 寻 第 的 结 
:Wo dd ol td) ee 

因此 公开 密 钥 密码 体制 的 使 用 在 概念 上 是 简单 的 。 但 是 有 两 点 必须 要 注意 。 首 先 应 关 
注 的 是 ， 尽 管 入 侵 者 截取 到 Alice 的 加 密 报 文 时 看 到 的 只 是 乱 伺 ， 但 是 和 人 侵 者 知道 该 公 针 
(显然 Bob 的 公 钥 是 全 世界 部 可 以 使 用 的 ) 和 Alice 加 密 所 用 的 算法 。Trudy 可 以 据 此 发 起 
选择 明文 攻击 ， 使 用 已 知 的 标准 加 密 算 法 和 Bob 的 公开 可 用 的 加 密 密 钥 对 她 所 选择 的 任意 
报 文 加 密 ! PEN, Trudy 可 以 尝试 对 她 怀疑 Alice 可 能 发 送 的 报 文 的 全 部 或 部 分 编码 。 很 明 
显 ， 如 果 公 开 密 钥 密码 要 能 工作 的 话 ， 密 钥 选 择 和 加 密 / 解 密 算 法 必须 保证 任 一 个 人 侵 者 


都 不 能 〈 至 少 要 困难 得 几乎 不 可 能 ) 确定 出 Bob 的 私 钥 或 以 某 种 方式 解密 或 猜 出 Alice 发 
给 Bob 的 报 文 。 第 二 个 值得 关注 的 问题 是 ， 既 然 Bob 的 加 密 密 钥 是 公开 的 ， 任 何人 (包括 
Alice 和 其 他 声称 自己 是 Alice 的 人 ) 都 可 能 向 Bob 发 送 一 个 已 加 密 的 报 文 。 在 单一 共享 密 
钥 情 况 下 ， 发 送 方 知 道 共享 秘密 密 钥 的 事实 就 已 经 向 接收 方 隐 含 含 地 证 实 了 发 送 方 的 导 份 . 
然而 在 公 钥 体制 中 ， 这 4 ABITE 了 了， 因为 任何 一 个 人 都 可 加 Bob 发 送 使 用 Bob 的 公开 可 
FY Be SH AR FRC. CHE m BET EE HB AKT AR CE OR, 数字 签名 是 我 们 在 
8.3 节 中 讨论 的 主题 。 

E= Kj; 公开 加 密 密 钥 

fie 人 5 私有 解密 密 铀 


A SCHR ST, m 





明文 报 文 » m 到 


m=K,(K,(m)) 


图 8-6 公开 密 钥 密码 


1. RSA 
尽管 可 能 有 许多 算法 处 理 这 些 关 注 的 问题 , 但 RSA 算法 (RSA algorithm， 取 算法 创 
SLA Ron Rivest, Adi Shamir 和 Leonard Adleman fj E FREMA) 几乎 已 经 成 了 公开 密 钥 密 
码 的 代名词 。 我 们 首先 来 理解 RSA 是 如 何 工作 的 ， 然 后 再 考察 RSA 的 工作 原理 
RSA 广泛 地 使 用 了 模 n 算术 的 算术 运算 。 故 我 们 简要 地 回顾 一 下 模 算术 。 前 面 讲 过 
mod n 只 是 表示 被 n RAY x 的 余数 ; 因此 如 19 mod 5 =4。 在 模 算 术 中 ， 人 们 执行 通常 的 加 
法 、 乘 法 和 指数 运算 。 然 而 ， 每 个 运算 的 结果 由 整数 余数 代替 ， 该 余数 是 被 n 除 后 留 下 的 
数 。 对 于 模 算 术 的 加 法 和 乘法 可 由 下 列 便于 施用 的 事实 所 简化 : 
| (a mod n) + (b mod n) |mod n= (a+b)modn 
| (a mod n) — (b mod n) |mod n= (a — b)mod n 
| (a mod n) * ((b mod n) |mod n= (a+ b)mod n 
从 第 三 个 事实 能 够 有 (a mod n)’ mod n =a" mod n, 我们 很 快 将 会 发 现 这 个 恒等式 是 非常 
有 用 的 。 
现在 假设 Alice 要 回 Bob 发 送 一 个 RSA 加 密 的 报 文 ， 如 图 8-6 Aras. 在 我 们 的 讨论 中 ， 
我 们 心中 永远 要 记 住 一 个 报 文 只 不 过 是 一 种 比特 模式 ， 并 且 所 有 每 种 比特 模式 能 唯一 地 被 
一 个 整数 (连同 该 比特 模式 的 长 度 ) 表示 。 例 如， 假设 一 个 报 文 是 比特 模式 1001; 这 个 
报 文 能 由 十 进 制 整数 9 来 表示 。 所 以 ， 当 用 RSA 加 密 一 个 报 文 时 ， 等 价 于 加 密 表 示 该 报 文 
的 这 个 唯一 的 整数 ， 
RSA 有 两 个 互相 关联 的 部 分 : 
© 公 钥 和 私 钥 的 选择 。 
。 加 密 和 解密 算法 。 
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为 了 生成 RSA 的 公 和 钥 和 私 钥 ，Bob 执行 如 下 步骤 : 

1 ) 选择 两 个 大 素数 Hq IBA p 和 9 应 该 多 大 呢 ” 该 值 越 大 ， 破 解 RSA 越 困 难 ， 
而 执行 加 密 和 解密 所 用 的 时 间 也 越 长 。RSA 实验 室 推 荐 ， 公 司 使 用 时 , p 和 gq 的 乘积 为 
1024 比特 的 数量 级 。 对 于 选择 大 素数 的 方法 的 讨论 ， 参 见 [Caldwell 2012]. 

2) 计算 n=pg 和 z=(p-1)(g-1)。 

3) 选择 小 于 的 一 个 数 e， 且 使 和 z 没 有 ( 非 1 的 ) 公 因 数 。 (这 时 称 e 与 z 互 
素 .) 使 用 字母 e 表示 是 因为 这 个 值 将 被 用 于 加 密 

4) 求 一 个 数 4d， 使 得 ed -1 HT WG z 整除 (就 是 说 ,没有 余数 )。 使 用 字母 d 表示 是 
因为 这 个 值 将 用 于 解密 。 换 句 话说 ， 给 定 e， 我 们 选择 4， 使 得 

ed modz = | 

5) Bob 使 外 界 可 用 的 公 钥 Ky 是 一 对 数 (n, e); HAGA K, 是 一 对 数 (n, d) 

Alice 执行 的 加 密 和 Bob 进行 的 解密 过 程 如 下 : 

e 假设 Alice 要 给 Bob 发 送 一 个 由 整数 m 表示 的 比特 组 合 ， 且 m <n。 为 了 进行 编码 ， 

Alice 执行 指数 运算 m, ARIA m 被 n 除 的 整数 余数 。 换 言 之 ，Alice 的 明文 报 
X m 的 加 密 的 值 c 就 是 
c=m modn 
对 应 于 这 个 密 文 c 的 比特 模式 发 送 给 Bob, 
© 为 了 对 收 到 的 密 文 报 文 c HRA, Bob 计算 : 
m = c" mod n 
这 要 求 使 用 他 的 私 钥 (n, d). 

举 一 个 简单 的 RSA 例子 ,假设 Bob 选择 p =5 和 9=7。!( 坦 率 地 讲 ， 这 样 小 的 值 无 法 
保证 安全 .) 则 =35 和 z=24。 因 为 5 和 24 没有 公 因 数 ， 所 以 Bob 选择 e =5; 最 后 ， 因 
x29 -1 ( 即 ed -1) 可 以 被 24 整除 ， 所 以 Bob 选择 d =29, Bob 公开 了 n=35 5 

这 两 个 值 ， 并 秘密 保存 了 d =29。 观 察 公 开 的 这 两 个 值 ， 假 定 Alice 要 发 送 字母 “ 
“o”, “v” HI “e” Z Bob。 用 1~26 之 间 的 每 个 数 表示 一 个 字母 ， 其 中 1 表示 a, 
26 表示 “z”，Alice 和 Bob 分 别 执行 如 表 8-2 和 表 8-3 所 示 的 加 密 和 解密 运算 。 注 意 到 在 
这 个 例子 中 ， 我 们 认为 每 四 个 字母 作为 一 个 不 同 报 文 。 一 个 更 为 真实 的 例子 是 把 这 四 个 字 
母 转 换 成 它们 的 8 比特 ASCII 表示 形式 ， 然 后 加 密 对 应 得 到 的 32 比特 的 比特 模式 的 整数 。 
(这 样 一 个 真实 的 例子 产生 了 一 些 长 得 难以 在 教科 书 中 打印 出 来 的 数 1) 

假定 在 表 8-2 和 表 8-3 中 的 简单 示例 已 经 产生 了 某 些 极 大 的 数 ， 并 且 假 定 我 们 前 面 看 
到 p Fl q 每 个 都 是 数 百 比特 长 的 数 ， 这 些 都 是 实际 使 用 RSA 时 必须 要 牢记 的 。 如 何 选择 大 
素数 ”如何 选择 e Ald? 以 及 如 何 对 大 数 进行 指数 运算 ”对 这 些 重 要 问题 的 详细 讨论 超出 
了 本 书 的 范围 ， 详 情 请 参见 [Kaufman 1995] 以 及 其 中 的 参考 文献 

表 8-2 Alice 的 RSA 加密,，e=5,，, n=35 


$L c= me mod n 





1 12 248832 17 








o 15 759375 15 
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% 8-3 Bob Ay RSA Z, d=29, n=35 


exe | oo maomodn | 明文 字母 


17 481968572106750915091411825223071697 a i 
15 12783403948858939111232757568359375 
851643319086537701956194499721106030592 


22 V 
10 100000000000000000000000000000 e 


2. 会 话 窗 其 

这 里 我 们 注意 到 ，RSA 所 要 求 的 指数 运算 是 相当 耗费 时 间 的 过 程 。 形 成 对 比 的 是 ， 
DES 用 软件 实现 要 比 RSA 快 100 们 ， 用 便 件 实现 则 要 快 1000 ~ 10 000 倍 | RSA Fast 
2012). 。 所 以 ， 在 实际 应 用 中 ，RSA 通常 与 对 称 密 钥 密 码 结 合 起 来 使 用 。 例 如 ， 如 采 Alice 
要 向 Bob 发 送 大 量 的 加 密 数 据 ， 她 可 以 用 下 述 方式 来 做 。 首 先 ，Alice 选择 一 个 用 于 加 密 
数据 本 身 的 密 钥 ; 这 个 密 钥 有 时 称 为 会 话 密 钥 (session key), BS WAHRAN K, 
Alice 必须 把 这 个 会 话 密 钥 告知 Babb， 因为 这 是 他 们 在 对 称 密 钥 密 人 码 (如 DES 或 AES) 中 
所 使 用 的 共享 对 称 密 钥 。Alice 可 以 使 用 Bob 的 RSA 公 钥 来 加 密 该 会 话 密 钥 ， 即 计算 c= 
ee )* mod n, Bob 收 到 了 该 RSA 加 密 的 会 话 密 钥 c 后 ， 解 密 得 到 会 话 密 钥 大 ,。Bob 此 时 已 

经 知道 Alice 将 和 要 用 于 她 的 加 密 数 据 传 输 的 会 话 密 钥 了 

3. RSA 的 工作 原理 

RSA 加 密 / 解 密 看 起 来 相当 神奇 。 为 什么 那样 应 用 加 密 算 法 ， 然 后 再 运行 解密 算法 ， 
就 能 恢复 出 初始 报 文 呢 ? 要 理解 RSA 的 工作 原理 ,我 们 仍 将 表示 n =pg， 其 中 p Aq 是 
RSA 算法 中 的 大 素数 。 

前 面 讲 过 在 RSA 加 密 过 程 中 ， 一 个 报 文 m (唯一 地 表示 为 整数 ) 使 用 模 n 算术 做 e 次 
ieee, Bll 













c = m mod n 

解密 则 先 对 该 值 执行 d URE, HR natio AUE Je AN A R Ea 2 Ae Cm" mod 
n) mod n。 下 面 我 们 来 看 ， 关 于 这 个 量 我 作 ] 能 够 得 到 什么 ，。 因 为 前 面 提 到 ， 模 算术 的 一 个 
重要 性 质 是 对 于 任意 值 a、n Ald 都 有 (a mod n)“ mod n =a" mod n。 因 此 ， 在 这 个 性 质 中 
使 用 a =m ， 则 有 

(m° mod n)“ mod n = m“ mod n 

因此 剩 下 证 明 m“ mod n =m, 尽管 我 们 正 试图 揭 开 RSA 工作 原理 的 神秘 面纱 ， 但 为 了 
做 到 这 一 点 ， 我 们 还 需要 用 到 数论 中 一 个 相当 神奇 的 结果 。 上 有 具体 而 言 ， 就 是 要 用 到 数论 中 
这 样 的 结论 : an FE p 和 q 是 素数 ， AA n = pq All z = (p s1) (q-1 ), Mij x’ mod n 与 YY mod z) 
mod n 是 等 同 的 [ Kaufman 1995 | 。 应 用 这 个 结论 ， 对 于 x =m Fly =ed, Ale 


(ed mod z) ; 
mod n 


m“ mod n =m 
但 是 要 记 住 ， 我 们 是 这 样 选择 e 和 d AY, Bled mod z=1。 这 告诉 我 们 
m“ mod n = m' modn=m 
这 正 是 我 们 希望 得 到 的 结果 ! 先 对 m fie URE CURE) FM d ORE (解密 )， 然 后 做 
模 的 算术 运算 (原文 中 没有 这 句 ， 译 者 认为 有 必要 补 上 。 一 一 详 者 注 )， ey 
的 m。 其 至 更 为 奇妙 之 处 是 这 样 一 个 事实 ， 如 果 我 们 先 对 m 做 d RE (加 密 ) FEB e 
即 颠 倒 加 密 和 解密 的 次 序 ， 先 执行 解密 操作 再 执行 加 蜜 操作， 我 们 也 能 得 到 初始 
奇妙 的 结果 完全 遵循 下 列 模 算术 : 
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(m“ mod n)“ mod n = m“ mod n = m“ mod n = (m mod n)“ mod n 

RSA 的 安全 性 依赖 于 这 样 的 事实 : 目前 没有 已 知 的 算法 可 以 快速 进行 一 个 数 的 因数 分 
解 ， 这 种 情况 下 公开 值 n 无 法 快速 分 解 成 紊 数 p 和 9g， 如 果 已 知 p Hg, MEAM e, 
就 很 容易 计算 出 秘密 密 钥 d。 在 男 一 方面 ， 也 不 确定 是 否 存 在 因数 分 解 一 个 数 的 快速 算法 ， 
从 这 种 意义 上 来 说 ，RSA 的 安全 性 也 不 是 确保 的 

另 一 种 流行 的 公 钥 加 密 算 法 是 Differ- Hellman， 我 们 将 在 课 后 习题 中 简要 探讨 它 
Differ- Hellman JF AR RSA 那样 多 功能 ， 即 它 不 能 用 于 加 蜜 任意 长 度 的 报 文 ; 然而 ， 它 能 
够 川 来 创建 一 个 对 称 的 会 话 密 钥 ， 该 密 乌 再 被 用 于 加 密 长 报 文 ， 


8.3 报 文 完整 性 和 数字 签名 


在 前 面 一 节 中 我 们 看 到 了 能 够 使 用 密码 术 为 两 个 通信 实体 提供 机 密 性 在 本 节 中 我 们 
转 回 提供 报 文 完整 性 (message integrity) 这 个 同等 重要 的 主题 ， 报 文 完 整 性 也 称 为 报 文 鉴 
州 、 连 同 报 文 完整 性 ， 在 本 市 中 我 们 将 讨论 两 个 相关 的 主题 ， 数字 签名 和 端点 鉴别 

FR TA EH Alice 和 Bob 来 定义 报 文 完整 性 问题 。 假 定 Bob 接收 到 一 个 报 文 (这 可 
能 已 经 加 密 或 可 能 是 明文 ) ， 并 且 他 认为 这 个 报 文 是 由 Alice 发 送 的 。 为 了 鉴别 这 个 报 文 ， 
Bob 年 要 让 实 : 

1 ) 该 报 文 的 确 源 自 Alice. 

2) 该 报 文 在 到 Bob 的 途中 没有 被 算 改 。 

我 们 将 在 8.4 ~8.7 节 中 看 到 ， 报 文 完整 性 这 个 问题 在 所 有 安全 网 络 协 议 中 前 是 至 关 
重要 有 的. 

举 一 个 特定 的 例子 ， 考 虑 一 个 使 用 链 路 状态 路 由 选择 算法 (例如 OSPF) 的 计算 机 网 
络 ， 在 该 网 络 中 决定 每 对 路 由 怖 之 间 的 路 由 (参见 第 4 章 )。 在 一 个 链 路 状态 算法 中 ， 每 
侣 路 由 硕 调 要 问 该 网 络 中 的 所 有 基 他 路 由 需 广 播 一 个 链 路 状态 报 文 . A RE BERR AS Se 
文 包括 直接 相连 邻 让 的 列表 以 及 到 这 些 邻 拓 的 直接 费用 。 一 旦 某 台 路 由 需 从 其 他 所 有 路 由 
条 ! 收 到 了 了 链 路 状态 报 文 ， 它 能 够 生成 该 网 络 的 全 网 ， 运 行 它 的 最 小 费用 路 由 选 拼 算 法 并 本 
置 它 的 转 友 表 ， 对 路 几 选 择 算 法 的 一 个 相对 容易 的 攻击 是 ，Trudy 分 发 具有 不 正确 状态 信 
县 的 虚假 链 路 状态 报 文 。 因 此 产生 了 报 文 完 整 性 的 再 求 : AH AE B 收 到 来 自 路 由 人 A 的 
链 路 状态 报 文 ， 路 由 硕 B 应 当 证 实 路 由 需 A 实际 生成 了 该 报 文 ， 并 且 进 一 步 证 实在 传输 过 
程 中 该 报 文 没有 被 算 改 ， 

在 本 世 中 ， 我 们 描述 一 种 由 许多 安全 网 络 协议 所 使 用 的 流行 报 文 完整 性 技术 .但 在 做 
此 事 之 前 ， 我 们 震 要 涉及 密 但 学 中 的 另 一 个 重要 主题 ， 即 密 但 散 列 困 数 ， 


8. 3.1 密码 散 列 函数 


如 图 8-7 所 示 ， 散 列 函 数 以 m 为 输入 ， 并 计算 得 到 一 个 称 为 散 列 的 固定 长 度 的 字符 下 
H(m)., 因特网 检验 和 (第 3 草 ) 和 CRC (第 4 章 ) 都 满足 这 个 定义 .密码 散 列 函数 
(cryptographic hash function) 要 求 且 有 和 下列 附加 的 性 质 : 

e 找到 任意 两 个 不 同 的 报 文 x Aly 使 得 H(x) = 有 yy)， 在 计算 上 是 不 可 能 的 ， 

不 严格 地 说 ， 这 种 性 质 就 意味 着 入侵 者 在 计算 上 不 可 能 用 其 他 报 文 替 换 由 散 列 函 数 保 
护 的 报 文 。 这 就 是 说 ， 如 果 (m，H(m) ) 是 报 文 和 由 发 送 方 生成 的 报 文 散 列 的 话 ， 则 入 
侵 者 不 可 能 伪造 另 一 个 报 文 y 的 内 容 ， 使 得 该 报 文具 有 与 原 报 文 相同 的 散 列 值 
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我 们 来 证 实 一 个 简单 的 检验 和 《如 内 特 网 检验 和 ) ESE 9 DO Fe BC eK BLAS 
像 在 因特网 检验 和 中 执行 反 人 码 运 算 邢 样 ， rene err fe— PS, FP ee 
到 一 起 ， A 用 4 字 节 的 块 来 进行 计算 。 假 定 Bob R Alice 100. 99 美元 并 且 回 Alice 发 送 一 
张 借 据 ， 这 个 借据 包含 以 下 文本 字符 串 “IOU100. 99BOB" 。 这 些 字 符 的 ASCH 表示 (以 十 
六 进 制 形式 表示 ) 为 49, 4F, 55, 31, 30, 30, 2E, 39, 39, 42, 4F, 42 










Dear Alice 
This ts a VERY long letter 
since there 5 so much to 


固定 长 度 散 列 : Hom) 





8-7 MOIRE 


图 8-8 上 半 部 分 显示 了 这 个 报 文 的 4 字 市 检验 和 是 B2 Cl D2 AC. 图 8-8 下 半 部 分 显 
示 了 一 条 稍微 不 同 的 报 文 (但 是 Bob 要 付 的 钱 却 多 了 许多 ) 。 报 文 “10U100. 99BOB” 和 
“IOU900. 19BOB” 有 相同 的 检验 和 。 因 此 ， 这 种 简单 的 检验 和 算法 违反 了 上 述 的 要 求 ， 给 
定 初 始 数据 ， 很 容易 找到 有 相同 检验 和 的 另 一 组 数据 .很 明显 ， 为 了 安全 起 见 ， 我 们 南村 


比 检验 和 更 为 噶 有 力 的 散 列 孙 数 . \ ASCII: 

Ron Rivest | RFC 1321] AY MDS 散 列 算 4F 55 31 
法 如 今 正在 广泛 使 用 。 这 个 算法 通过 4 步 过 w e a 
程 计 算得 到 128 比特 的 散 列 。 这 4 步 过 程 由 Cl D2 AC 
下 列 步骤 组 成 : 只 填充 一 一 先 填 1， 然 后 填 


足够 多 的 0， 直 到 报 文 长 度 满足 一 定 的 条 件 ; ASES 
@) 添 加 一 一 在 填充 前 添加 一 个 用 64 比特 表示 55 39 
的 报 文 长 度 ; @@ 初 始 化 累加 器 ; DM 在 ao 
最 后 的 循环 步骤 中 ， 对 报 文 的 16 5 SUE 4 B2 Cl D2 AC 
FEARS. MDS 的 描述 (包括 一 个 C 源 代 人 码 
实现 ) 可 参见 [RFC 1321 ] 。 

目前 正 使 用 的 第 二 个 主要 报 文摘 要 算法 是 安全 散 列 算法 SHA-1 (Security Hash Algo- 
rithm) [FIPS 1995 ] 。 这 个 算法 的 原理 类 似 于 MD4 [RFC 1320) 设计 中 所 使 用 的 原理 ， 而 
MD4 是 MDS 的 前 身 。SHA-1 是 美国 联邦 政府 的 标准 ， 任何 联邦 政府 的 应 用 程序 如 果 击 要 
使 用 密码 散 列 算法 的 话 ， 都 要 求 使 用 SHA-1。SHA-1 生成 一 个 160 比特 的 报 文摘 要 。 较 长 
的 输出 长 度 可 使 SHA-1 更 安全 。 


8.3.2 报 文 鉴别 码 
我 们 现在 再 回 到 报 文 完整 性 的 问题 。 既 然 我 们 理解 了 散 列 函数 ， 就 先 来 看 一 下 将 如 何 

















He] 8-8 初始 报 文 和 欺诈 报 文具 有 相同 的 检验 和 
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执行 报 文 完整 性 : 

1) Alice 生成 报 文 m 并 计算 散 列 H(m) (例如 使 用 SHA-1)。 

2) Alice 则 将 H(m) 附加 到 报 文 m 上 ， 生 成 一 个 扩展 报 文 (m，H(m))， 并 将 该 扩 
展 报 文 发 给 Bob 

3) Bob 接收 到 一 个 扩展 报 文 (m, h) 并 计算 H(m)。 如 果 H(m) =h, Bob 得 到 结 
ie: HEH o 

这 种 方法 存在 明显 缺陷 。Trudy fie ee WUE BAR m, EPE Rp bE Alice ， 计 算 
H(m') 并 发 送 给 Bob (m', H(m')). “4 Bob 接收 到 该 报 文 ， 一 切 将 在 步骤 3 中 核对 通 
过 ， 并 且 Bob 无 法 猜 出 这 种 不 轨 的 行为 。 

为 了 执行 报 文 完整 性 ， 除 了 使 用 密码 散 列 浮 数 ，Alice 和 Bob 将 需要 共享 秘密 *。 这 个 
共享 的 秘密 只 不 过 是 一 个 比特 串 ， 它 被 称 为 鉴别 密 钥 (authentication key ) 。 使 用 这 个 共 盏 
秘密 ， 报 文 完整 性 能 够 执行 如 下 : 

1) Alice 生成 报 文 m， 用 ;级 联 m 以 生成 m+s， 并 计算 散 列 H(m+s) (例如 使 用 
SHA-1). H(m+s) 被 称 为 报 文 鉴别 码 (Message Authentication Code, MAC), 

2) Alice M MAC 附加 到 报 文 m 上 ， 生 成 扩展 报 文 (m，H(m +s))， 并 将 该 扩展 报 
文 发 送 给 Bob. 

3) Bob 接收 到 一 个 扩展 报 文 (m,，h)， 由 于 知道 s， 计 算出 报 文 鉴别 码 H(m+s)。 如 
果 H(m+s) =h, Bob 得 到 结论 : 一 切 正 常 。 

图 8-9 中 显示 了 上 述 过 程 的 总 结 。 读 者 们 应 当 注 意 到 这 里 的 MAC (表示 “ 报 文 鉴 别 
码 ”) 与 用 于 数据 链 路 层 中 的 MAC (表示 “媒体 访问 控制 ") 是 不 一 样 的 ! 


一 | wo H (m+s) 
io " 





— 因特网 
po 


z H (m+s) 
图 例 : 
Cr] -nx 
;= 共享 秘密 


图 8-9 报 文 鉴别 码 


MAC 的 一 个 优良 特点 是 它 不 要 求 一 种 加 密 算 法 。 的 确 ， 在 许多 应 用 中 ， 包 括 前 面 讨论 
的 链 路 状态 路 由 选择 算法 ， 通信 实体 仅 关 心 报 文 完整 性 ， 并 不 关心 报 文 机 密 性 。 使 用 一 个 
MAC， 实 体能 够 鉴别 它们 相互 发 送 的 报 文 ， 而 不 必 在 完整 性 过 程 中 综合 进 复 杂 的 加 密 过 程 。 

如 你 所 猜测 ， 多 年 来 已 经 提出 了 若干 种 对 MAC 的 不 同 标准 。 目 前 最 为 流行 的 标准 是 
HMAC， 它 能 够 与 MDS 或 SHA-1 一 道 使 用 。HMAC 实际 上 通过 散 列 滑 数 运行 数据 和 鉴别 
we EH VK | Kaufman 1995; RFC 2104 | 。 

这 里 还 遗留 下 一 个 重要 问题 。 我 们 怎样 回 通信 实体 分 发 这 个 共享 的 鉴别 密 钥 呢 ? 例 
如 ， 在 链 路 状态 路 由 选择 算法 中 ， 我 们 将 在 某 种 程度 上 需要 向 目 治 系统 中 的 每 台 路 由 融 分 
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Be VK As SEH. CE ENT Ae Arneng ABEE RH.) 一 名 网 络 管理 员 能 
es ee 
快 ， 并 且 如 果 每 台 路 由 需 都 有 它 自 己 的 公 钥 ， 那 么 该 网 络 管理 员 能 够 用 路 由 天 的 公 钥 加 窗 
该 鉴别 密 钥 并 分 发 给 任何 一 台 路 由 吾 ， 从 而 通过 网 络 回路 用 需 发 送 加 密 的 密 钥 . 


8. 3.3 数字 签名 


回想 在 过 去 的 一 周 中 ， 你 在 纸 上 已 经 签 过 多 少 次 你 的 名 字 ?” 你 可 能 经 常会 在 文昌 fa 
用 卡 收据 、 法 律 文件 和 信件 上 签名 。 你 的 签名 证 明 你 (而 不 是 其 他 人 ) 水 认 和 /或 同意 这 
些 文件 的 内 容 。 在 数字 领域 ， 人 们 通 篆 大 要 指出 一 个 文件 的 所 有 者 或 他 作者， 或 者 表明 某 
人 认可 一 个 文件 内 容 。 数 字 签 名 (digital signature) 就 是 在 数字 领域 实现 这 些 日 标的 一 种 
密码 技术 ， 

正如 人 手 签字 一 样 ， 数 字 签 名 也 应 当 以 可 鉴别 的 、 不 可 伪造 的 方式 进行 。 这 就 是 说 ， 
必须 能 够 证 明 由 某 个 人 在 一 个 文档 上 的 签名 确实 是 由 该 人 签 普 的 (该 签名 必须 是 可 证 实 
的 ) ， 且 只 有 那个 人 能 够 签署 那个 文件 ( 该 签名 无 法 伪造 ). 

我 们 现在 来 考虑 怎样 设计 一 个 数字 签名 方案 。 当 Bob 签署 一 个 报 文 时 ， 可 以 观察 到 
Bob 必须 将 某 些 对 他 是 独特 的 东西 放置 在 该 报 文 上 。， Bob Fee ZIEMII — + MAC 用 作答 
名 ， 其 中 MAC 是 由 他 的 密 钥 ( a 作用 到 该 报 文 上 而 生成 的 ， 然 后 得 到 该 散 
SIF. mi Alice 为 了 验证 该 签名 ， 她 必须 也 具有 该 密 钥 的 副本 ， 在 这 种 情况 下 该 窗 钥 对 
Bob 将 不 是 唯一 的 。 因 此 ， mee MAC 是 无 法 胜任 这 项 工作 的 : 

前 面 讲 过 使 用 公 钥 密码 ，Bob 具有 公 钥 和 私 铀 ， 这 两 种 密 钥 对 Bob 均 为 独特 的 。 央 
此 ， 公 钥 密 钥 是 一 种 提供 数字 签名 的 优秀 候选 者 。 我们 现在 来 研究 一 下 这 是 怎样 完成 的 

假设 Bob 要 以 数字 方式 签署 一 个 文档 m。 我 们 能 够 想象 这 个 文档 是 Bob 打算 签署 并 发 
送 的 一 个 文件 或 一 个 报 文 。 如 图 8-10 Wr, A POC, Bob EIXE H th ny AH 
K; 计算 Ks (m)。 乍 一 看 ， 会 感觉 很 奇怪 ，Bob 怎么 会 用 他 的 私 钥 (在 8.2 节 中 ， 我 们 用 
私 钥 解密 用 其 公 钥 加 密 的 报 文 ) 签署 文档 ! 但 是 回想 加 密 和 解密 都 只 不 过 是 数学 运算 而 已 
CRSA 中 所 做 的 e 或 d 指数 寡 运 算 ; Bul 8.2 市 )， 并 且 Bob 的 目的 不 是 弄 乱 或 掩盖 文档 的 
内 容 ， 而 只 是 要 以 可 鉴别 的 、 不 可 伪造 的 方式 签署 这 个 文档 。Bob 对 文档 m 签名 之 后 所 得 
的 文档 就 是 大 > (im). 





签名 的 报 文 : Kaim) 
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图 8-10 ”对 一 个 文档 生成 一 个 数据 签名 




















Dear Alice: 
Sorry | have been unable 
to write for so long. Since 





Bob 的 私 钥 Ks 





TEAPA PAKS ”457 





数字 签名 Kim) 是 否 满足 了 可 鉴别 的 、 不 可 伪造 的 需求 ”假设 Alice 有 mm 和 Ki (m), 
她 要 在 法 庭 上 证 明 (进行 诉讼 ) Bob 确实 签署 过 这 个 文档 ， 他 就 是 唯一 能 够 签署 该 文档 的 
A... Alice 持 有 Bob 的 公 和 钥 Ki ， 并 把 它 用 于 Bob 的 数字 签名 大 Cm) 上 ， 从 而 得 到 了 文档 m. 
也 就 是 说 ，Alice 计算 Ki (Ki (m)), WE! 在 Alice 经 历 了 令 人 注目 的 慌乱 后 得 到 了 m， 它 与 
初始 文档 完全 一 致 。 然 后 ，Alice 就 可 以 论证 仅 有 Bob 能 够 签署 这 个 文档 ， 基 于 如 下 理由 : 
e 无 论 是 谁 签署 这 个 报 文 ， 都 必定 在 计算 签名 大 (m) 过 程 中 使 用 了 人 人; 这 个 私 雏 ， 
使 Ki (Ks (m) ) =Mo 

e 知道 K; 这 个 私 钥 的 唯一 人 只 有 了 Bob。 从 8.2 节 我 们 对 RSA 的 讨论 中 可 知 ， 知 道 公 
H K; 无 助 于 得 知 私 钥 AK, 的 信息 . At, Ali AG A, 的 人 才 是 生成 密 钥 对 
(Ky, Kp) 的 人 ， 而 这 个 人 首当其冲 就 是 Bob (注意 到 此 处 假设 Bob 没有 把 人; 
淖 露 给 任何 人 ， 也 没有 人 从 Bob Yb ii HUI A, .) 

注意 到 下 列 问 题 是 重要 的 ， 如 果 源 文档 到 被 修改 过 ， 比 如 改 成 了 另 一 个 文档 下" ， 则 
Bob 对 m 生成 的 签名 对 m'e, AN Ky (Ky, (m)) 不 等 于 m 。 因 此 我 们 看 到 数字 签名 也 
提供 完整 性 ， 使 得 接收 方 验证 该 报 文 未 被 自 改 ， 同 时 也 验证 了 该 报 文 的 源 ，。 

对 用 加 密 进 行 数据 签名 的 担心 是 ， 加 密 和 解密 的 计算 代价 昂贵 . 给 定 加 解密 的 开销 ， 
通过 完全 加 密 / 解 密 对 数据 签名 是 杀 鸡 用 牛刀 .更 有 效 的 方法 是 将 散 列 阴 数 引入 数字 签名 
8.3.2 节 中 讲 过 ， 一 种 散 列 算法 取 一 个 任意 长 的 报 文 m， 计算 生成 该 报 文 的 一 个 固定 长 度 
的 数据 “指纹 ”"， 表 示 为 H(m)。 (EHIK, Bob 对 报 文 的 散 列 签名 而 不 是 对 报 文本 
OEY, BI Bob 计算 Ks (H (m)). AA H(m) Wa Ay FR SC m 小 得 多 ， 所 以 生成 数字 答 
名 所 需要 的 计算 耗费 大 为 降低 . 
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图 8-11 发 送 数字 签名 的 报 文 
在 Bob 向 Alice 发 送 一 个 报 文 的 情况 下 ， 图 8-11 提供 了 生成 一 个 数字 签名 的 操作 过 程 
的 概览 。Bob 让 他 的 初始 长 报 文通 过 一 个 散 列 浮 数 。 然 后 他 用 自己 的 私 钥 对 得 到 的 散 列 进 
行 数 字符 名 。 明 文 形 式 的 初始 报 文 连 同 已 经 数字 签名 的 报 文摘 要 (从 此 以 后 可 称 为 数字 签 
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名 ) 一 道 被 发 送 给 Alice 。 图 8-12 提供 了 鉴别 报 文 完 整 性 的 操作 过 程 的 概览 。Alice 先 把 发 
送 方 的 公 钥 应 用 于 报 文 获得 一 个 散 列 结果 。 然 后 她 再 把 该 散 列 函 数 应 用 于 明文 报 文 以 得 到 
第 二 个 散 列 结果 。 如 果 这 两 个 散 列 匹配 ， 则 Alice 可 以 确信 报 文 的 完整 性 及 其 发 送 方 。 


签名 的 散 列 
Fgkopdgoo69cmxw a 
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Dear Alice 
This i a VERY long letter 
since there 5 so much to 
Say 
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图 8-12 验证 签名 报 文 


在 继续 学 习 之 前 ， 我 们 简要 地 将 数字 签名 与 MAC 进行 比较 ， 尽 管 它 们 有 类 似 之 处 ， 
但 也 有 重要 的 微妙 差异 。 数 字 签 名 和 MAC 都 以 一 个 报 文 (或 一 个 文档 ) 开始 。 为 了 从 该 
报 文中 生成 一 个 MAC， 我 们 为 该 报 文 附加 一 个 鉴别 密 钥 ,然后 取得 该 结果 的 散 列 。 注 意 
到 在 生成 MAC 过 程 中 有 既 不 涉及 公开 密 角 加密， 也 不 涉及 对 称 密 钥 加 密 。 为 了 生成 一 个 数 
字 签 名 ,我 们 首先 取得 该 报 文 的 散 列 ， 然 后 用 我 们 的 私 钥 加 密 该 报 文 (使 用 公 钥 密码 )。 
因此 ， 数 字 签 名 是 一 种 “技术 含量 更 高 的 ”技术 ， 因 为 它 需要 一 个 如 后 面 描述 的 、 具 有 认 
证 中 心 支撑 的 公 钥 基础 设施 (PKI) 。 我 们 将 在 8. 4 节 中 看 到 ，PGP 是 一 种 流行 的 安全 电子 
邮件 系统 ， 为 了 报 文 完整 性 而 使 用 数字 签名 。 我 们 已 经 看 到 了 OSPF 为 了 报 文 完整 性 而 使 
用 MAC, 我 们 将 在 8.5 WA 8.6 节 中 看 到 MAC 也 能 用 于 流行 的 运输 层 和 网 络 层 安全 协议 

公 角 认证 

数字 签名 的 一 个 重要 应 用 是 公 钥 认证 (public key certification) ， 即 证 实 一 个 公 钥 属于 
茶 个 特定 的 实体 。 公 钥 认 证 被 用 于 许多 流行 的 安全 网 络 协议 中 ， 包 括 IPsec 和 SSL. 

为 了 深入 理解 这 个 问题 ,我们 考虑 一 个 因特网 商务 版 本 的 经 典 的 “ 比 陡 恶作剧 假 
定 Alice 正在 从 事 比 院 派 送 业务 ， 从 因特网 上 接受 订单 。Bob 是 一 个 爱 吃 比萨 的 人 ， 他 癌 
Alice 发 送 了 一 份 包含 其 家 诞 地 址 和 他 希望 的 比 酝 类 型 的 明文 报 文 ，Bob 在 这 个 报 文中 也 包 
含 一 个 数字 签名 ( 即 对 原始 明文 报 文 的 签名 的 散 列 )， 以 向 Alice 证 实 他 是 该 报 文 的 真正 来 
源 。 为 了 验证 这 个 数字 签名 ，Alice 获得 了 Bob 的 公 钥 (也许 从 公 钥 服务 器 或 通过 电子 邮 
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件 报 文 ) 并 核对 该 数字 签名 .通过 这 种 方式 ，Alice 确信 是 Bob 而 不 是 某 些 青少年 恶作剧 
者 下 的 比萨 订单 。 

在 聪明 的 Trudy 出 现 之 前 ， 这 一 切 看 起 来 进行 得 相当 好 .如 在 图 8-13 HR, Trudy 
沉溺 于 一 场 亚 作 剧 中 。Trudy 回 Alice 发 送 一 个 报 文 ， 在 这 个 报 文中 她 说 她 是 Bob ， 给 出 了 
Bob 家 的 地 址 并 订购 了 一 个 比萨 。 在 这 个 报 文 中 ， 她 也 包括 了 她 (Trudy) 的 公 钥 ， 虽 然 
Alice 目 然 地 假定 它 就 是 Bob 的 公 钥 ，Trudy 也 附加 了 一 个 签名 , 但 是 这 是 用 她 自己 
(Trudy) 的 私 钥 生 成 的 ,在 收 到 该 报 文 后 ，Alice 就 会 用 Trudy 的 公 钥 (Alice 认为 它 是 
Bob 的 公 钥 ) 来 解密 该 数字 签名 ， 并 得 到 结论 : 这 个 明文 报 文 确实 是 由 Bob 生成 的 。 而 当 
外 送 人 员 带 着 具有 意大利 辣 香 肠 和 凤 尾 鱼 的 比萨 到 达 Bob 家 时 ， 他 会 感到 非常 惊讶 ! 










Alice, 
Deliver a pizza to me : €; 
Bob j 






fë FH Trudy fy fA 
答 名 的 报 文摘 要 


| 
Fgkopdgoo69cmxw | 

S4psdtermalasofmz | 

\ \ 









图 8-13 Trudy JAZS 15 GF Bob 


从 这 个 例子 我 们 看 到 ， 要 使 公 钥 密码 有 用 ， 需 要 能 够 证 实 你 具有 的 公 钥 实际 上 就 是 与 
你 要 进行 通信 的 实体 ( 人员、 路 由 器、 浏览 融和 等 ) 的 公 钥 。 例如 ， 当 Alice 与 Bob 使 用 公 
钥 密 码 通信 时 ， 她 需要 证 实 她 假定 是 Bob 的 那个 公 钥 确实 就 是 Bob WASH. 

将 公 钥 与 特定 实体 绑 定 通常 是 由 认证 中 心 (Certification Authority, CA) 完成 的 ，CA 
的 职责 就 是 使 识别 和 发 行 证 书 合 法 化 .CA 具有 下 列 作用 : 

1) CA 证实 一 个 实体 (一 个 人 、 一 台 路 由 如 等 ) 的 真实 身份 。 如 何 进 行 认证 并 没有 
强制 的 过 程 。 当 与 一 个 CA 打交道 时 ， 一 方 必 须 信 任 这 个 CA 能 够 执行 适当 的 严格 身份 验 
证 。 例 如 ， 如 果 Trudy 可 以 走 进 名 为 Fly- by- Night 的 证 书 权 威 机 构 并 只 是 宣称 “我 是 
Alice”， 就 可 以 得 到 该 机 构 颁 发 的 与 Alice 的 身份 相关 联 证 书 的 话 ， 则 人 们 不 会 对 Fly- by- 
Night 证 书 权 威 机 构 所 签发 的 公 钥 证 书 有 太 多 的 信任 ;在 男 一 方面 ， 人 们 可 能 愿意 (或 不 
愿意 !) 信任 某 个 CA， 如 果 这 个 CA 是 联邦 或 州 计 划 的 一 部 分 的 话 。 你 对 与 公 钥 相 联系 的 
且 份 的 信任 程度 ， 仅 能 达到 你 对 CA 及 其 身份 验证 技术 的 信任 程度 。 我 们 编织 了 多 么 混乱 
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的 信任 关系 网 啊 ! 

2) 一 旦 CA 验证 了 某 个 实体 的 身份 ， 这 个 CA 会 生成 一 个 把 其 身份 和 实体 的 公 钥 绑 定 
起 来 的 证 书 ( hy 1x4 [> ue. T 包 合 本 这 SA EH RIZ \ 钥 所 有 者 全 局 唯一 的 吴 份 标识 信息 nO 
(例如 ， 一 个 人 的 名 字 或 一 个 1P 地 址 )。 由 CA 对 这 个 证 书 进 行 数 字 签 名 。 这 些 步 又 显示 
在 图 8-14 中 

我 们 现在 来 看 怎样 使 用 认证 来 对 抗 
“ 比 了 订 购 ” 中 的 恶作剧 者 〈 如 Trudy ) 
和 其 他 意外 情况 ， 当 Bob 下 订单 的 同时 ， 
他 也 发 送 了 其 CA SUE TS. Alice 使 用 
CA 的 公 钥 来 核对 Bob 证 书 的 合法 性 并 提 
到 Bob AY ZS 44 . 

国际 电信 联盟 (International Telecom- 三 Bob 的 CA 签署 
munication Union, ITU) $I IETF 都 人 研发 了 包含 了 他 的 公 
用 于 CA 的 系列 标准 。ITU X. 509 [rru OER 
2005a | 规定 了 证 书 的 鉴别 服务 以 及 特定 
语法 。 [RFC 1422] 描述 了 安全 因特网 peal “Bob tere ier el GA Bay 
电子 邮件 所 用 的 基于 CA 的 密 钥 管理 ， 它 和 X. 509 FRA, (ALL X. 509 增加 了 密 钥 管理 体系 
结构 的 创建 过 程 和 约定 内 容 。 表 8-4 显示 了 一 份 证 书 中 的 某 些 重要 字段 

表 8-4 在 X.509 和 RFC 1422 公 钥 证 书 中 的 部 分 字段 


字段 名 描述 
版 本 (Version ) X. 509 般 范 的 版 本 号 


序列 号 (Serial Number) CA 发 布 的 证 书 的 独特 标识 符 

签名 (Signature ) | 规定 了 由 CA 所 用 的 对 该 证 书签 名 的 算法 

MZ. ARS (Issuer Name ) 发 行 该 证 书 的 CA 的 标识 符 ， 用 的 是 区 别名 (DN) 格式 [RFC 4514 | 
有 效 期 ( Validity period ) 汪 书 合法 性 开始 和 结束 的 时 间 范 围 


CA 的 私 钥 人 ，， 
E= 


认证 中 心 
(CA) 















































ESA (Subject name ) | 其 会 钥 与 该 证 书 相 联系 的 实体 标识 符 ， 用 DN 格式 
主题 公 钥 (Subject public kev) | 该 主题 的 公 钥 以 及 该 公 和 钥 使 用 的 公 和 钥 算 法 (及 其 参数 ) 的 指示 


8.4 端点 鉴别 


端点 鉴别 (end-point authentication ) wi ANIL : 体 经 过 计算 机 网 络 回 另 一 个 实体 证 明 
其 身份 的 过 程 ， 例 如 一 个 人 问 某 个 电子 邮件 服务 咒 证 明 其 身份 。 作 为 人 类 ， 我 们 通过 多 种 
a ip a 5 lan ae es LET 打 电 话 时 我 们 分 辨 对 方 的 声音 ， 海 关 的 


ae. 我 们 这 论 所 网 络 通信 的 双方 如 何 能 够 鉴别 彼此 ， 此 处 我 们 重点 关注 当 通 信 
实际 发 生 时 鉴别 “活动 的 ”实体 。 一 个 具体 的 例子 是 一 个 用 户 回 某 电子 邮件 服务 右 鉴 别 他 
或 她 自己 。 这 与 证 明 在 过 去 的 某 点 接收 到 的 报 文 确实 来 日 声称 的 发 送 方 和 月 有 不 同 ， 如 8. 3 
TITIR o 

当 经 网 络 进行 鉴别 时 ， 通 信 各 方 不 能 依靠 生物 信息 比如 外 表 、 声 波纹 等 进行 身份 鉴 
别 。 的 确 ， 我 们 会 在 后 面 的 实例 人 研究 中 看 到 ， 诸 如 路 由 融 、 客 户 / 服 务 胡 进 程 等 网 络 元 系 
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iS AH E gl, Wb, EH E Fhe SC AA REAR E, MEASAN ( au- 
thentication protocol) 的 一 部 分 独立 完成 。 鉴别 协议 通 党 在 两 个 通信 实体 运行 其 他 协议 ( 例 
如 ， 可 徘 数 据 传 给 协议 、 路 由 选择 信息 交换 协议 或 电子 邮件 协议 ) 之 前 运行 。 鉴别 协议 首 
先 建立 相互 满意 的 各 方 的 标识 ; 仅 当 鉴别 完成 之 后 ， 各 方才 继续 下 面 的 工作 . 

同 第 3 章 中 我 们 阐释 可 靠 数 据 传 输 协 议 (rdt) 的 情况 类 似 ， 我 们 发 现 阐释 各 种 版 本 
的 鉴别 协议 一 一 我 们 将 称 为 ap (authentication protocol) 一 一 是 有 局 发 的 ， 并 随 肴 我 们 学 
习 的 深 入 指出 各 个 版 本 的 潮 洞 。 (如 果 你 豆 欢 这 种 逐步 式 的 设计 演化 ， 你 也 许 政 欢 看 
| Bryant 1988 | ， 这 本 书 虚 构 了 开放 网 络 鉴 别 系统 的 设计 者 则 的 故事 ， 以 及 他 们 对 许多 相关 
奇妙 问题 的 发 现 - ) 

我 们 假设 Alice 要 加 Bob 鉴别 她 日 己 的 里 份 


8.4.1 鉴别 协议 ap1.0 


岂 许 我 们 能 够 想象 出 的 最 简单 的 鉴别 协议 就 是 : Alice 直接 发 送 一 个 报 文 给 Bob, ， 说 她 
Hae Alicee。 这 个 协议 如 图 8-15 Bras, 这 个 协议 的 缺陷 是 明显 的 ， 即 Bob 无 法 判断 发 送 报 
文 “我 是 Alice” 的 人 确实 就 是 Alice. 例如 ，Trudy (入 侵 者 ) 也 可 以 发 送 这 样 的 报 文 。 





Alice Bob 
p X 
3 我 是 Alice 
A) 
Trudy 





[4] 8-15 Pp apl. O 和 一 种 失败 的 情况 


8.4.2 鉴别 协议 ap2.0 


如 果 Alice 有 一 个 总 是 用 于 通信 的 周知 网 络 地 址 (如 一 个 IP 地 址 )， 则 Bob 能 够 试图 
通过 验证 携带 鉴别 报 文 的 IP 数据 报 的 源 地 址 是 否 与 Alice 的 周知 IP 地 址 相 匹 配 来 进行 鉴 
别 。 在 这 种 情况 下 ，Alice 就 可 被 鉴别 了 -。 这 可 能 阻止 对 网 络 一 无 所 知 的 人 假 骨 Alice, {E 
是 它 却 不 能 阻止 决定 学 习 本 书 的 学 生 或 许多 其 他 人 ! 

根据 我 们 学习 的 网 络 层 和 数据 链 路 层 的 知识 ， 我 们 就 会 知道 做 下 列 事情 并 不 困难 ( 例 
如 ， 如 果 一 个 人 能 够 访问 操作 系统 代码 并 能 构建 自己 的 操作 系统 内 核 比如 Linux 和 许 
多 其 他 免费 可 用 的 操作 系统 ) : 生成 一 个 IP 数据 报 ， 并 在 IP 数据 报 中 填 入 我 们 希望 的 任 
意 源 地 址 (比如 Alice 的 周知 IP 地 址 ) ， 再 通过 链 路 层 协议 把 生成 的 数据 报 发 送 到 第 一 跳 
路 由 天 ，。 此 后 ， 有 具有 不 正确 源 地 址 的 数据 报 就 会 忠实 地 回 Bob 转发 。 这 种 方法 显示 在 图 8-16 
H, Ci IP 哄骗 的 一 种 形式 。 如 果 Trudy 的 第 一 跳 路 由 各 被 设置 为 只 转发 包含 Trudy 的 IP 
源 地 址 的 数据 报 ， 束 可 以 避免 IP 哄骗 | REC 2827] ， 然 而， 这 一 措施 并 未 得 到 广泛 采用 或 
强制 实施 。Bob 可 能 因为 假定 Trudy 的 网 络 管理 员 (这 个 管理 员 可 能 就 是 Trudy AE) 已 
经 配置 Trudy 的 第 一 跳 路 由 各 ,使 之 只 能 转发 适当 地 址 的 数据 报 而 被 欺骗 。 
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图 8-16 协议 ap2.0 和 一 种 失败 的 情况 


8.4.3 鉴别 协议 aps. 0 


进行 鉴别 的 一 种 经 典 方法 是 使 用 秘密 口令 。11 令 是 鉴别 者 和 被 鉴别 者 之 间 的 一 个 共享 

A 3%. Gmail, Telnet, FTP 和 许多 其 他 服务 使 用 口令 鉴别 。 在 协议 ap3.0 P., Alice (AIK Ie] 
Bob 发 送 其 秘密 口令 ， 如 图 8-17 HR. 
Alice Bob 


六 





L 我 是 Alice, 4S 全 
OK 
Trudy 


磁带 记录 机 





图 8-17 协议 ap3.0 和 一 种 失败 的 情况 


由 于 口令 的 广泛 使 用 ， 我 们 也 许 猜 想 协议 ap3.0 相当 安全 。 如 果 这 样 想 ,我们 就 错 
T! 这 里 的 安全 性 缺陷 相当 明显 : 如 果 Trudy 窃听 了 Alice 的 通信 ， 则 可 得 到 Alice 的 口 
A. 为 了 使 你 认识 到 这 种 可 能 性 ,考虑 这 样 的 事实 ， 当 你 Telnet 到 男 一 个 机 右上 并 登录 
时 ， 登录 口令 未 加 密 就 发 送 到 了 Telnet MBH. HERES Telnet 客户 或 服务 LAN AYER A 
Ab] EMRE (sniff) ( 读 并 存储 ) 在 局 域 网 上 传输 的 所 有 数据 分 组 ， 并 因此 究 取 到 该 注册 
口令 。 实 际 上 ， 这 是 一 种 家 取 口令 的 周知 方法 (Man, Bul | Jimenez 1997 | ) 。， 这 样 的 威 
胁 显 然 是 真实 存在 的 ， 所 以 协议 ap3.0 明显 也 不 可 行 


8.4.4 鉴别 协议 aps. 1 


我 们 完善 协议 ap3. 0 的 下 一 个 想法 和 目 然 就 是 加 密 口 令 了 。 通 过 加 蜜 口令 ， 我 们 能 够 防 
ik Trudy 得 知 Alice 的 口令 。 如 果 我 们 假定 Alice 和 Bob 共享 一 个 对 称 秘密 密 钥 Ky M 
Alice 可 以 加 密 口 令 ， 并 回 Bob 发 送 其 识别 报 文 “我 是 Alice” MIRAS. Bob 则 解密 
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口令 ， 如 果 口 令 正确 则 鉴别 了 Alice, 因为 Alice 不 仅 知 道口 令 ， 而 且 知 道 用 于 加 密 口令 的 
共享 秘密 密 钥 值 ，Bob 才 可 以 轻松 地 鉴别 Alice 的 号 份 。 我 们 称 这 个 协议 为 ap3. 1， 

尽管 协议 ap3. 1 确实 防止 了 Trudy 得 知 Alice 的 口令 ， 此 处 使 用 密码 术 并 不 能 解决 鉴别 
问题 ，Bob 受制 于 回放 攻击 (playback attack); Trudy Hii By Alice 的 通信 ， 并 记录 下 该 
口令 的 加 密 版 本 ， 并 回 Bob 回放 该 口令 的 加 密 版 本 ， 以 假装 她 就 是 Alice, 协议 ap3. 1 中 加 
党 口令 的 使 用 ， 并 未 使 它 比 图 8-17 中 的 协议 ap3.0 的 局 面 有 明显 改观 。 


8.4.5 鉴别 协议 ap4. 0 


图 8-17 中 的 失败 的 情况 是 因为 Bob 不 能 区 分 Alice 的 初始 鉴别 报 文 和 后 来 入 侵 者 回放 
的 Alice 的 初始 鉴别 报 文 所 致 。 也 就 是 说 ，Bob 无 法 判断 Alice 是 耕 还 活跃 ( 即 当 前 是 否 还 
在 连接 的 另 一 端 ) ， 或 他 接收 到 的 报 文 是 否 就 是 前 面 鉴 别 Alice 时 录制 的 回放 ,， 观 察 力 极 强 
的 读者 会 记 起 TCP 的 三 次 握手 协议 需要 处 理 相 同 的 问题 ， 如 果 接 收 的 SYN 报 文 段 来 目 较 
早 连接 的 一 个 SYN 报 文 段 的 旧 副 本 (重新 传输 ) 的 话 ，TCP 连接 的 服务 需 一 侧 不 会 接受 


该 连接 。TCP 服务 器 一 侧 如 何 解决 “判断 客户 是 否 真正 还 活路 ”的 问题 呢 ? 它 选择 一 个 很 
长 时 间 内 都 不 会 再 次 使 用 的 初始 序号 ， 然 后 把 这 个 序号 发 给 客户 ， 然 后 等 待 客户 以 包含 这 


个 序号 的 ACK 报 文 段 来 啊 应 ， 此 处 我 们 能 够 为 鉴别 目的 采用 同样 的 思 ] 

ABH (nonce) 是 在 一 个 协议 的 生存 期 中 只 使 用 一 次 的 数 。 也 就 是 说 ， 一 旦 某 协 以 使 
用 了 一 个 不 重 数 ， 就 永远 不 会 再 使 用 那个 数字 了 。 协议 ap4. 0 以 如 下 方式 使 用 一 个 不 重 数 : 

1) Alice [ae] Bob 发 送 报 六 “我 是 Alice”, 

2) Bob 选择 一 个 不 重 数 RR， 然 后 把 这 个 值 发 送 给 Alice, 

3) Alice 使 用 她 与 Bob 共享 的 对 称 秘密 密 钥 K， "来 加 密 这 个 不 重 数 ， 然 后 把 加 蜜 的 不 
RAK, a(R) 发 回 给 Bob, 与 在 协议 ap3. 1 中 一 样 ， 由 于 Alice AE K, 并 用 它 加 密 一 个 
值 ， 就 使 得 Bob 知道 收 到 的 报 文 是 由 Alice 产生 的 。 这 个 不 重 数 用 于 确定 Alice 是 活跃 的 。 

4) Bob 解密 接收 到 的 报 文 。 如 果 解 密 得 到 的 不 重 数 等 于 他 发 送 给 Alice 的 那个 不 重 
AX, WAY ASH Alice Ay Ef. 

协议 ap4. O 如 图 8-18 所 示 。 通 过 使 用 这 个 在 生存 Alice Bob 
期 中 只 出 现 一 次 的 值 RR 然后 核对 返回 的 值 KK，,(R)， > | 
Bob 能 够 确定 两 点 : Alice 是 她 所 声称 的 那个 人 因为 
好 知道 加 密 R 所 需 的 秘密 密 钥 )，Alice 是 活跃 的 (IA 





为 她 已 经 加 密 了 Bob 刚刚 产生 的 不 重 数 R). | R 
不 重 数 和 对 称 密 钥 密码 体制 的 使 用 形成 了 ap4.0 K,»(R) 
O ameman er mE IES 


的 基础 。 一 个 自然 的 问题 是 ， 我们 是 否 能 够 使 用 不 重 

数 和 公开 密 钥 密码 体制 (而 不 是 对 称 密 钥 密码 体制 ) ° 

来 解决 鉴别 问题 ? 这 个 问题 将 在 本 章 后 面 的 习题 中 进 图 8-18 协议 ao4.0， 无 失败 的 情况 
行 探讨 。 


8.5 安全 电子 邮件 


在 前 面 的 各 节 中 ， 我 们 分 析 了 网 络 安 全 中 的 基本 问题 ， 包 括 对 称 密 钥 密 码 体制 和 公开 
密 钥 密码 体制 、 端 点 鉴别 、 密 钥 分 发 、 报 文 完整 性 和 数字 签名 。 我 们 现在 着 手 研 究 如 何 使 
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用 这 些 工 具 在 因特网 中 提供 安全 

有 趣 的 是 ， et 而 4 层 的 任 一 层 提供 安全 性 服务 是 可 能 的 。 当 为 某 一 特 
定 的 应 用 层 夫 议 提供 安全 性 时 ， 则 使 用 这 一 协议 的 应 用 程序 将 能 得 到 一 种 或 多 种 安全 服 
务 ， 诸 如 机 密 性 、 鉴 别 或 完整 性 。 为 某 一 运输 层 协 议 提 供 安 全 性 时 ， 则 所 有 使 用 这 一 协议 
的 应 用 程序 邦 可 以 得 到 该 运输 层 协 议 所 提供 安全 性 服务 。 在 基于 主机 到 主机 的 网 络 层 提 供 
安全 性 时 ， 则 所 有 运输 层 报 文 段 〈 当然 也 包括 所 有 应 用 层 数 据 ) 都 可 以 得 到 该 网 络 层 所 提 
供 的 安全 服务 ， 当 基于 一 条 链 路 提供 安全 性 时 ， 则 经 过 这 个 链 路 传输 的 所 有 帧 中 的 数据 部 
得到 三 该 链 路 提供 的 安全 性 服务 

在 8.5 ~8.8 方 中 ， 我 们 考察 了 如 何在 I Hie 运输 层 、 网 络 层 和 数据 链 路 层 中 使 用 
这 些 安全 性 工具 .为 了 与 本 书 的 整体 框架 保持 一 致 ， 我 们 从 协议 栈 的 顶层 开始 ， 讨论 在 应 
用 层 的 安全 性 。 我 们 的 方 pe 如 电子 邮件 ， 作 为 应 用 层 安 全 性 的 一 个 
学 习 案 例 。 pi ] 沿 协议 栈 癌 下， 分 析 SSL 协议 〈 它 在 运输 层 提 供 安 全 性 ) IPsec 协议 
( 它 在 网 络 层 提供 安全 性 )， 以 及 IEEE 802. 11 无 线 局 域 网 协议 的 安全 性 - 

你 可 能 会 SSIS k; 为 什 么 要 在 因特网 的 多 个 层次 上 提供 安全 性 功能 呢 ? 仅 在 网 络 层 
提供 安全 性 功能 并 加 以 实施 还 不 足够 吗 ” 对 这 个 问题 有 两 个 答案 。 首 先 ， 尽 管 可 以 通过 加 
de (如 所 有 的 运输 层 报 文 段 ) ， 以 及 通过 鉴别 所 有 数据 报 的 源 IP 地 

， 在 网 络 层 能 够 提供 “地 毯 式 覆盖 ”安全 性 ， 但 是 旦 却 并 不 能 提供 用 户 级 的 安全 性 。 例 
7 一 个 商业 站 点 不 能 依赖 下 层 安全 性 来 鉴别 一 个 在 该 站 点 购买 商品 的 顾客 。 因 此 ， 此 
处 除了 较 低 层 的 地 悉 式 敌 盖 安全 性 外 ， 还 重要 更 高 层 的 安全 性 功能 。 第 二 ， 在 协议 栈 的 较 
iaje 上 部 莹 新 的 因特网 服务 (包括 安全 性 服务 ) 通常 较为 容易 。 而 等 待 在 网 络 层 上 广泛 地 
部 次 安 全 性 ， 可 能 还 需要 未 来 若干 年 才能 解决 ， 许 多 应 用 程序 的 开发 者 “着 手 做 起 来 ”， 
并 在 他 们 中 意 的 应 用 程序 中 引入 安全 性 功能 。 一 个 典型 的 例子 就 是 PGP (Pretty Good Priva- 
cy) ， 它 提供 了 安全 电子 邮件 〈 将 在 本 节 后 面 讨论 ) 。 由 于 只 需要 客户 和 服务 需 应 用 程序 代 
i, PGP 是 第 一 个 在 因特网 上 得 到 广泛 应 用 的 安全 性 技术 。 


8.5.1 安全 电子 邮件 


我 们 现在 使 用 8.2 ~8.3 密码 学 原则 来 生成 一 个 安 竹 UT 地 件 系 统 。 FR AT] PA ae at 
的 方式 来 产生 这 个 噩 层 设计 ， 每 一 步 引 入 一 些 新 安全 性 服务 。 当 设计 安全 电子 邮件 系统 
时 ， 我 们 震 要 记 住 最 初 在 8.1 方 中 所 介绍 的 那个 有 趣 的 例子 ， H Alice 和 Bob 之 间 的 风流 
dt R F Alice 发 送 一 个 电子 邮件 报 文 给 Bob, mi Trudy 试图 入 侵 的 情况 . 

在 做 出 为 Alice 和 Bob 设计 一 个 安全 电子 邮件 系统 的 努力 之 前 ， 我 们 应 当 痛 先 考虑 他 
们 最 为 布 望 的 安全 特性 是 什么 . 重 中 之 重 是 机 密 性 。 正 如 8. 1 节 讨论 的 那样 ，Alice 或 Bob 
ABA A HE Trudy 阅读 到 Alice 所 发 送 的 电子 邮件 报 文 。Alice 和 Bob 最 希望 在 该 电子 邮件 系 
统 中 看 到 的 第 二 种 特性 是 具备 发 送 方 鉴别 。 特 别 是 ， 当 Bob 收 到 这 样 的 报 文 “1 don’t love 
you anymore. | never want to see you again. Formerly yours, Alice (我 不 册 爱 你 了 了。 我 册 也 不 
想 看 到 你 了 -Alice)” 时 ，Bob 自然 而 然 地 要 确定 这 个 报 文 确实 来 日 Alice， 而 非 Trudy 发 
送 的 。 为 外 ， 这 了 两 个 情人 欣赏 的 为 一 种 特性 是 报 文 完整 性 ， 也 就 是 说 ， 确 保 Alice 所 发 的 
报 文 在 发 送 给 Bob 的 过 程 中 没有 被 改变 。 最 后 ， 电 子 邮 件 系统 应 当 提 供 接 收 方 鉴别 ; 即 
Alice 布 望 确定 她 的 确 正在 癌 Bob 发 信 ， 而 不 是 向 假冒 Bob 的 其 他 人 (4n Trudy) 发 信 . 

因此 我 们 从 处 理 最 为 关注 的 机 密 性 开始 。 提 供 机 密 性 的 最 直接 方式 是 Alice 使 用 对 称 
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AIAN (如 DES ok AES) 加 密 所 要 传输 的 报 文 ， 而 Bob 则 在 接收 时 对 报 文 解密 。 如 8.2 
节 讨 论 的 那样 ， 如 果 对 称 密 钥 足 够 长 ， 且 仅 有 Alice 和 Bob 拥有 该 密 钥 ， 则 其 他 人 (包括 
Trudy) 要 想 读 懂 这 条 报 文 极为 困难 .尽管 这 种 方法 直截了当 ， 但 因为 仅 有 Alice 和 Bob A 
有 该 密 钥 的 副本 ， 这 使 得 分 发 对 称 密 钥 非常 困难 (我 们 在 8.2 节 中 讨论 过 ) 。 因 此 我 们 目 
然 就 考虑 用 其 他 方法 一 一 公开 密 钥 密码 (例如 使 用 RSA) 。 在 公开 密 钥 方法 中 ，Bob 使 得 
他 的 公 钥 为 公众 所 用 (例如 ， 从 一 台 公 钥 服务 关 或 其 个 人 网 页 上 得 到 ) ，Alice 用 Bob 的 公 
钥 加 密 她 的 报 文 ， 然 后 向 Bob 的 电子 邮件 地 址 发 送 该 加 密 报 文 。 当 Bob 接收 到 这 个 报 文 
提供 所 和 硕 望 的 机 密 性 的 极 好 方法 。 然而， 存在 的 一 个 问题 是 公开 密 钥 加 密 的 效率 相对 低 
下 ,尤其 对 于 长 报 文 更 是 如 此 。 

为 了 克服 效率 问题 ,我 们 利用 了 会 话 密 钥 (在 8.2.2 Pied). AMR: 
(DAlice 选 择 一 个 随机 对 称 会 话 密 钥 ;; 久 用 这 个 对 称 密 钥 加 密 她 的 报 文 m; OH Bob 的 
ASA Ki 加 密 这 个 对 称 密 钥 ; 由 级 联 该 加 密 的 报 文 和 加 密 的 对 称 密 钥 以 形成 一 个 “ 包 ”; 
In] Bob 的 电子 邮件 地 址 发 送 这 个 包 。 这 些 过 程 显 示 在 图 8-19 中 (在 这 张 图 和 下 一 张 因 
中 ， 和 市 疾 的 “+ ”表示 级 联 ， 诗 圈 的 “- ”表示 级 联 的 分 解 )。 当 Bob 接收 到 这 个 包 时 : 
(他 使 用 其 私 钥 Ks 得 到 对 称 密 钥 Ks 人 @) 使 用 这 个 对 称 密 钥 K, 解密 报 文 m。 


K, Cm) Ks (m) 
MN wm K (o) K, ©*) m 





we semis 








m| K o) AER K$ CK.) 
Alice RIS E F BER Xn Bob 接 收 电 子 邮 件 报 文 m 
X 8-19 Alice 使 用 一 个 对 称 会 话 密 钥 大 . 回 Bob 发 送 一 个 安全 电子 邮件 


设计 完 提 供 机 密 性 的 安全 电子 邮件 系统 后 ， 现 在 我 们 设计 另 一 个 可 以 提供 发 送 方 鉴别 
和 报 文 完整 性 的 系统 。 我 们 暂且 假设 Alice 和 Bob 目前 不 关心 机 密 性 (他们 要 和 其 他 人 分 
享 他 们 的 爱情 !) ， 只 关心 发 送 方 鉴别 和 报 文 完整 性 。 为 了 完成 这 个 任务 ， 我 们 使 用 如 8. 3 
节 所 描述 的 数字 签名 和 报 文摘 要 。 具 体 说 来 : (DAlice 对 她 要 发 送 的 报 文 m 应 用 一 个 散 列 
KX H (例如 MD5) ， 从 而 得 到 一 个 报 文 摘要 ; 用 她 的 私 钥 大， 对 散 列 男 数 的 结果 进行 
签名 ， 从 而 得 到 一 个 数字 签名 ; DIMMU (AINE) 和 该 数字 签名 级 联 起 来 生成 一 个 
包 ; la] Bob 的 电子 邮件 地 址 发 送 这 个 包 。 当 Bob 接收 到 这 个 包 时 : DAG Alice AY 24% 
Ki 应 用 到 被 签名 的 报 文摘 要 上 ; 已 将 该 操作 的 结果 与 他 自己 对 该 报 的 散 列 有 进行 比较 。 
在 图 8-20 中 阐述 了 这 些 步 骤 。 如 8.3 节 中 所 讨论 ， 如 果 这 两 个 结果 相同 ， 则 Bob 完全 可 
以 确信 这 个 报 文 来 日 Alice AAR. 

现在 我 们 考虑 设计 一 个 提供 机 密 性 、 发 送 方 鉴别 和 报 文 完整 性 的 电子 邮件 系统 。 这 可 
以 通过 把 图 8-19 和 图 8-20 中 的 过 程 结合 起 来 而 实现 。Alice 首先 生成 一 个 预备 包 ， 它 与 
图 8-20 中 的 包 完 全 相同 ， 其 中 包含 她 的 初始 报 文 和 该 报 文 数字 签名 过 的 散 列 。 然 后 Alice 
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把 这 个 预备 包 看 作 一 个 报 文 ， 再 用 图 8-19 中 的 发 送 方 的 步骤 发 送 这 个 新 报 文 ， 即 生成 一 
个 新 包 发 给 Bob, Alice 所 做 的 这 些 步骤 如 图 8-21 所 示 。 当 Bob 接收 到 这 个 包 后 ， 他 首先 
应 用 图 8-19 中 他 这 一 侧 的 步 又， 然后 再 应 用 图 8-20 中 他 这 一 侧 的 步骤 。 应 当 明 确 这 一 攻 
计 的 目标 是 提供 机 密 性 、 发 送 方 鉴别 和 报 文 完 整 性 。 注意 到 在 这 一 方案 中 ，Alice 两 次 使 
用 了 公开 密 钥 密码 : 一 次 用 了 她 的 私 钥 ， 另 一 次 用 了 Bob 的 公 钥 。 同 样 ，Bob 也 两 次 使 用 
了 公开 密 钥 密码 : 一 次 用 了 他 的 私 钥 ， 一 次 用 了 Alice AAH. 


mY Kk Ce Ce K, (H(m))I 
m i) m K, (。) A A K‘ a 
op 了 G 因特网 =} 








AT 5 
m | r 
Alice RIE E F BB AF Se Xm Bob 接 收 电 子 邮 件 报 文 m 
图 8-20 ”使 用 散 列 函 数 和 数字 签名 来 提供 发 送 方 鉴别 和 报 文 完整 性 


图 8-21 所 示 的 安全 电子 邮件 系统 可 能 在 大 多 数 情 况 下 都 能 为 大 多 数 电 子 邮 件 用 户 提 
供 满 意 的 安全 性 。 但 是 仍 有 一 个 重要 的 问题 没有 人 解决。 图 8-21 中 的 设计 要 求 Alice 获得 
Bob 的 公 钥 ， 也 要 求 Bob 获得 Alice 的 公 钥 。 但 这 些 公 钥 的 分 发 并 不 是 一 个 小 问题 。 例 如 ， 
Trudy 可 能 假冒 Bob， 发 给 Alice 她 自己 的 公 钥 ， 并 告诉 Alice 这 个 公 钥 是 Bob WAH, (E 
得 Trudy 就 能 接收 到 Alice 发 给 Bob 的 报 文 。 如 我 们 在 8.3 节 所 学 ， 安 全 地 分 发 公 钥 的 一 种 
常用 方法 是 通过 CA 验证 该 公 钥 。 
K, (H(m)) 





图 8-21 Alice 使 用 对 称 密 钥 密码 、 公 开 密 钥 密码 、 散 列 函 数 和 
数字 签名 来 提供 安全 性 、 发 送 方 鉴别 和 报 文 完 整 性 





Philip Zimmermann 和 PGP 


Philip R. Zimmermann Æ PGP (Pretty Good Privacy) 的 创造 者 。 他 因此 在 长 达 三 年 的 
时 间 里 成 为 犯罪 调查 的 目标 ， 因 为 美国 政府 认为 在 1991 年 以 后 的 时 间 里 ，PGP 在 世界 
范围 内 以 免费 软件 形式 发 布 ， 违 反 了 美国 对 加 密 软 件 出 口 的 限制 。 在 PGP 作为 共享 软件 
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发 布 后 ， 有 人 把 PGP 放 到 了 因特网 上 ， 美国 以 外 的 外 国人 也 可 以 下 载 它 。 在 美国 ， 加 窗 
程序 分 类 为 军用 品 ， 依 据 联 邦 法 律 不 得 出 口 到 国外 ， 

尽管 缺乏 资金 ， 没 有 收入 ， 也 没有 公司 的 支持 ， 还 要 受到 政府 的 干预 ,但 PGP 还 是 
成 为 了 世界 上 广泛 使 用 的 电子 邮件 加 密 软 件 。 奇 怪 的 是 ， 因 为 Zimmermann 案件 ， 美 
政府 无 意 中 促 进 了 PGP 的 传播 : 

美国 政府 在 1996 年 初 放 弃 了 这 个 案子 。 这 一 声明 得 到 了 许多 因特网 团体 的 喝彩 。 
Zimmermann 案件 已 经 成 为 无 章 的 个 人 为 了 自己 的 权益 反抗 强大 的 政府 滥用 职权 的 历史 。， 
政府 的 让 步 是 值得 庆幸 的 事 ， 部 分 原因 是 由 于 在 国会 中 对 因特网 审查 制度 的 游说 ， 以 及 
FBI 推动 允许 越 来 越 多 的 政府 侦 听 。 

在 政府 撤 案 后 ，Zimmermann 建立 了 PGP 公司 ， 该 公司 于 1997 年 12 月 并 入 网 络 联 
盟 (Network Associates). Zimmermann 现在 是 密码 学 领域 中 一 位 独立 咨询 者 . 
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Philip Zimmermann F 1991 年 所 写 的 PGP (Pretty Good Privacy) 是 一 个 电子 邮件 加 密 
方案 ， 如 今 已 经 成 为 一 个 事实 上 的 标准 。 其 Web 站 点 以 每 个 月 百 万 页 的 规模 ， 为 在 166 个 
国家 的 用 户 提 供 服 务 | PGPI 2012 | 。 在 公共 领域 中 有 各 种 版 本 的 PCP 可 供 使 用 ; 例如 ， 你 
能 够 在 国际 PGP 的 主页 上 为 你 喜爱 的 平台 找到 PCP 软件 以 及 许多 有 趣 的 读物 [ PCPI 
2012] 。( 特别 是 PGP 作者 所 撰写 的 一 篇 特别 有 趣 的 文章 [Zimmermann 2012].) PGP 的 设计 
在 本 质 上 和 图 8-21 中 所 示 的 设计 相同 。PGP 软件 的 不 同 版 本 使 用 MDS 或 使 用 SHA 来 计算 报 
文摘 要 ; 使 用 CAST、 三 重 DES 或 IDEA 进行 对 称 密 钥 加 密 ; 使 用 RSA 进行 公开 密 钥 加 密 。 

安装 PGP 时 ， 软 件 为 用 户 产 生 一 个 公开 密 钥 对 。 该 公 钥 能 被 张贴 到 用 户 的 网 站 上 或 放 
置 在 茶 台 公 钥 服务 关上 。 私 钥 则 使 用 用 户口 令 进 行 保护 。 用 户 每 次 访问 私 钥 时 都 要 输入 这 
PAS. PGP 人 允许 用 户 选择 是 否 对 报 文 进行 数字 签名 、 加 密 报 文 ， 或 同时 进行 数字 签名 和 
加 密 。 图 8-22 显示 了 一 个 PCP 签名 的 报 文 。 这 个 报 文 在 MIME 首部 之 后 出 现 。 报 文中 的 
IN BAK, (A(m)), ， 即 数字 签名 的 报 文摘 要 。 如 我 们 上 述 讨论 ，Bob 为 了 验证 报 文 的 
完整 性 ， 需 要 得 到 Alice AJAH. 


Can I see you tonight? 
Passionately yours, Alice 


Version: PGP for Personal Privacy 5.0 
Charset: noconv 
yhHJRHhGJGhgg/12EpJ+lo8gE4vB3mqJhFEvZP9t6n7G6m5Gw2 





图 8-22 PGP 签名 报 文 
图 8-23 显示 了 一 个 秘密 PGP 报 文 。 这 个 报 文 也 出 现在 MIME 首部 之 后 。 当 然 ， 明 文 
报 文 不 包括 在 这 个 秘密 电子 邮件 报 文中 。 当 一 个 发 送 方 (例如 Alice) 要 确保 机 密 性 和 完 
整 性 时 ，PCP 在 如 图 8-23 所 示 的 报 文中 包含 一 个 类 似 于 图 8-22 中 的 报 文 。 
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Version: PGP for Personal Privacy 5.0 
u2R4d+/jKmn8Bc5+hgDsqAewsDfrGdszx681likm5F6Gc4sDfcxyt 


RfdS10juHgbcfDssWe7 /K=1KhnMikLo0+1/BvcxX4t==Ujk9PbcD4 
Thdf2awQfgHbnmK lok8iy6gThlp 
END PGP MESSAGE 





图 8-23 一 个 秘密 PGP 报 文 


PGP 也 提供 了 一 种 会 钥 认证 机 制 ， 但 是 这 种 机 制 与 更 为 传统 的 CA 差异 很 大 ，PGP 公 
钥 由 一 个 可 信 Web 验证 。 当 Alice 相信 一 个 密 钥 /用 户 名 对 确实 匹配 时 ， 她 目 己 就 可 以 验 
证 这 一 密 钥 /用 户 名 对 。 此外，PGP IF Alice 为 她 所 信任 的 用 户 鉴 别 更 多 密 钥 提供 担保 . 
一 些 PGP 用 户 通 过 保持 密 钥 签署 方 (key-signing party) 互相 签署 对 方 的 密 钥 。 用 户 实际 走 
到 一 起 ， 交 换 公 铀 ， 并 用 自己 的 私 钥 对 对 方 的 公 钥 签名 来 互相 验证 密 甸 


8.6 使 TCP 连接 安全 : SSL 


在 而 一 三 中 ， 我 们 看 到 对 一 个 特定 的 应 用 ( 即 电子 邮件 )， 密 码 技 术 是 怎样 提供 机 密 性 、 
数据 完整 性 和 端点 鉴别 的 。 在 这 一 市 中 ， 我 们 在 协议 栈 中 向 下 一 层 ， 考 察 密友 技术 如 何 用 安 
全 性 服务 加 强 TCP， 该 安全 性 服务 包括 机 密 性 、 数 据 完 整 性 和 端点 鉴别 。TCP 的 这 种 强化 版 
本 通常 被 称 为 安全 套 接 字 层 (Secure Socket Layer, SSL). SSL 版 本 3 的 一 个 稍 加 修改 的 版 本 
被 称 为 运输 层 安全 性 (Transport Layer Security, TLS), 已 经 由 IETF 标准 化 | RFC 4346]. 

SSL 最 初 由 Netscape 设计 ， 而 使 TCP 相 先 于 Netscape 的 工作 (例如 ， 


参见 | Woo 1994 | ) 。 由 于 SSL AYR AA, EOE CZ A. SSL 得 到 了 所 有 流行 
Web 浏览 入 和 Web | aur 的 文 择 ， 并 基本 上 oe 用 于 所 有 因特网 商业 站 点 (包括 Amazon、 
eBay, Yahoo! | MSN “ ， 每 年 经 SSL 花费 了 数 百 亿 美元 。 事 实 上 ， 如 果 你 使 用 信用 卡通 


过 因特网 购 头 任何 ti 在 你 的 浏览 莫 和 服务 右 之 则 的 通信 儿 乎 一 定 使 用 了 SSL，。，( 当 
你 使 用 浏览 希 时 , 知 URL 以 https: 开始 而 不 是 以 htp 开始 ， 就 能 认定 正在 使 用 SSL. ) 
为 了 理解 SSL 的 高 求 ， 我 们 浏览 一 下 某 典 型 的 因特网 商业 的 场景 。Bob 在 Web E yp 
WW, BGA F Alice 公司 的 站 点 ， 这 个 站 点 正在 出 售 香水 。Alice 公司 站 点 显示 了 一 个 表格 ， 
假定 Bob 可 以 在 该 表格 中 输入 香水 的 类 型 和 所 希望 的 数量 、 他 的 地 址 和 他 的 支付 卡号 等 信 
I, Bob 输入 这 些 信息 ， 点 击 “ 提 交 ”， 就 期 待 收 到 (通过 普通 邮政 邮件 ) 所 购买 的 香水 ; 
他 也 期 竺 者 在 他 的 下 一 次 文 付 卡 报表 中 收 到 对 所 购物 品 的 支付 信息 。 所 有 这 一 切 听 起 来 不 
错 ， 但 是 如 果 不 采 取 安 全 措施 ，Bob 也 许 会 有 一 些 意外 ， 
© 如 有 果 没 有 使 用 机 密 性 ( 加密), 一 个 入 侵 者 可 能 截取 Bob 的 订单 并 得 到 他 的 支付 卡 
Ad. PSA eM AT LAY Bob 的 费用 来 购买 商品 。 
e 如果 没有 使 用 完整 性 ， 入 侵 者 可 能 修改 Bob 的 订单 ， 让 他 购买 比 希 望 瓶 数 多 10 信 
的 香水 。 
e 最 后 ， 如 果 没 有 使 用 服务 带 鉴别 ， 这 个 显示 Alice 公司 著名 徽标 的 服务 融 实 际 上 是 
由 Trudy 维护 的 一 个 站 点 ，Trudy 正在 假冒 Alice 公司 。 当 Trudy 收 到 Bob 的 订单 
ki, PREE T Bob 的 钱 一 走 了 之 。 或 者 Trudy 可 能 充当 一 名 壬 份 鳃 贼 ， 收 集 Bob 
的 名 字 、 地 址 和 信用 卡号 . 
SSL 通过 采用 机 密 性 、 数 据 完 整 性 、 服 务 兢 鉴 别 和 客户 鉴别 来 强化 TCP， 就 可 以 解决 
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SSL 经 常用 来 为 发 生 在 HTTP 之 上 的 事务 提供 安全 性 . 然而， 因为 SSL 使 TCP 安全 

， 因 此 它 能 被 应 用 于 运行 在 TCP 之 上 的 任何 应 用 程序 i | 

应 用 程序 .SSL 提供 了 一 个 商 单 的 具有 套 接 字 E cc ei 应 用 层 
的 应 用 编程 接口 《API) ， 该 接口 类 似 于 TCP 的 [ 应 用 程序 “| 
API。 当 一 个 应 用 程序 要 使 用 SSL 时 ， 它 包括 F 
F SSL 类 / 库 。 如 在 网 8-24 中 所 示 ， 尽 管 SSL | Te | | P 
— 上 位 于 应 用 层 中 ， 但 从 人 研发 者 的 角度 看 ， | oP | | IP | 

是 一 个 提供 TCP 服务 的 运输 协议 ， 而 这 里 的 TCP API 用 SSL 加 强 的 TCP 
TCP 服务 用 安全 性 服务 加 强 了 。 图 8-24 ”尽管 SSL 技术 上 位 于 应 用 层 中 ， 但 从 


8.6.1 宏观 描述 研发 者 的 角度 看 它 是 一 个 运输 协议 

我 们 从 描述 一 个 简化 的 SSL 版 本 开始 ， 这 将 使 我 们 从 宏观 上 理解 SSL 的 工作 原理 和 工 
作 过 程 。 我 们 将 这 个 SSL 的 简化 版 本 称 之 为 “类 SSL”, WRK SSL 之 后 ， 在 下 一 小 节 
中 我 们 将 描述 真实 的 SSL, EEM X SSL (和 SSL) 具有 三 个 阶段 : 握手 、 密 钥 导 出 
和 数据 传输 。 我 们 现在 描述 针对 一 个 客户 (Bob) 和 一 个 服务 硕 (Alice) 之 间 的 通信 会 话 
的 这 三 个 阶段 ， 其 中 Alice 具有 私 钥 / 公 钥 对 和 将 她 的 号 份 与 其 公 钥 绑 定 的 证 书 

1. 握手 

在 握手 阶段 ，Bob mæ: (与 Alice 创建 一 条 TCP 连接; DIE Alice 是 真实 的 Alice; 
3 发 送 给 Alice 一 个 主 密 钥 ，Bob 和 Alice 持 用 该 主 密 钥 生 成 SSL 会 话 所 需 的 所 有 对 称 密 
铀 ,这 三 个 步骤 显示 在 图 8-25 中 。 注意 到 一 旦 创建 了 TCP 连接 ，Bob 就 向 Alice 发 送 一 个 
hello 报 文 。Alice 则 用 她 的 证 书 进 行 啊 应 ,证书 中 包含 了 她 的 公 钥 。 如 在 8.3 节 所 讨论 
因为 该 证 书 已 被 某 CA 证 实 过 ，Bob 明白 无 误 地 知道 该 公 钥 属于 Alice, Ja, Bob 产生 一 
个 主 密 钥 (MS) (该 MS 将 仅 用 于 这 个 SSL 会 话 ) H Alice 的 公 钥 加 密 该 MS 以 生成 加 密 
的 主 密 钥 (EMS) ， 并 将 该 EMS 发 送 给 Alice, Alice 用 她 的 私 钥 解 密 该 EMS 从 而 得 到 该 
MS, 在 这 个 阶段 后 ，Bob 和 Alice (而 无 别 的 人 ) 均 知 道 了 用 于 这 次 SSL 会 话 的 主 密 钥 。 


ES, _§ 


A > 
© | +CPISYNACK 
bess TCP ACK . 
| 一 一 ,， 
D- 证 书 
@) + 
| : EMS=K* (MS) 
FAK ;解密 EMS 
生成 主 密 钥 (MS) : 得 到 MS 


图 8-25 类 SSL 握手， 首先 建立 一 个 TCP 连接 
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2. wea tilt 

从 原则 上 上 讲 ，MS 此 时 已 由 Bob 和 Alice FES, €E AI TERT Al ha AR I oF Al CH e HE ME 
恰 查 的 对 称 会 话 密 钥 。 然 而 ， 对 于 Alice 和 Bob 每 人 而 言 ， 使 用 不 同 的 密码 密 钥 ， 并 且 对 
于 加 密 和 完整 性 检查 也 使 用 不 同 的 密 铀 ， 通 和 认为 更 为 安全 。 央 此 ，Alice 和 Bob 部 使 用 
MS 生成 4 个 密 铂 : 

e E, HIFA Bob 发 送 到 Alice 的 数据 的 会 话 加 密 密 针 

e MM,， 用 于 从 Bob 发 送 到 Alice 的 数据 的 会 话 MAC 44 
E，,， 用 于 从 Alice 发 送 到 Bob 的 数据 的 会 话 加 密 密 销 

e M,, HHFA Alice 发 送 到 Bob 的 数据 的 会 话 MAC REH 

Alice 和 Bob 每 人 都 从 MS 生成 4 个 密 钥 ”这 能 够 通过 直接 将 该 MS 分 为 4 个 密 钥 来 实 
现 ，( 但 在 真实 的 SSL 中 更 为 复杂 一 些 ， 我 们 后 面 将 会 看 到 .) 在 密 钥 导出 阶段 结束 时 ， 
Alice 和 Bob 都 有 了 4 个 密 钥 。 其 中 的 两 个 加 密 密 钥 将 用 于 加 密 数 据 ; 两 个 MAC 密 钥 将 用 
于 验证 数据 的 完整 性 . 

3， 数 据 传输 

既然 Alice 和 Bob 共享 相同 的 4 个 会 话 密 钥 (Eg, Mg, E, 和 )， 他 们 就 能 够 经 TCP 
连接 开始 发 送 安全 的 数据 。 因为 TCP 是 一 种 字 节 流 协议 ,一 种 自然 的 方法 是 用 SSL 在 传输 
中 加 密 应 用 数据 ， 然 后 将 加 密 的 数据 在 传输 中 传 给 TCP. 但 是 如 采 我 们 真 的 这 样 做 ， 我 们 
将 用 于 完整 性 检查 的 MAC BEF AAP Ab WE? 我 们 无 疑 不 希望 等 到 TCP 会 话 结束 时 才 验 证 所 有 
Bob 数据 的 完整 性 ，Bob 数据 的 发 送 要 经 历 整个 会 话 ! 为 了 解决 这 个 问题 ，SSL 将 数据 流 
分 割 成 记录 ， 对 每 个 记录 附加 一 个 MAC 用 于 完整 性 检查 ， 然 后 加 密 该 “记录 + MAC”. 为 
了 产生 这 个 MAC，Bob 将 数据 连同 密 钥 M, 放 和 一 个 散 列 曙 数 中 ， 如 在 8.3 节 所 讨论 ,为 
了 加 密 “ 记 录 +MAC” 这 个 包 ，Bob 使 用 他 的 会 话 加 密 密 钥 天。 然后 这 个 加 密 的 包 将 传 
递 给 TCP 经 因特网 传输 。 

里 然 这 种 方法 几经 周折 ， 但 它 为 整个 报 文 流 提 供 数 据 完整 性 时 仍 未 达到 无 懈 可 击 。 特 
别 是 ， 假 定 Trudy 是 一 名 “中 间 人 ”， 并 且 有 在 Alice 和 Bob 之 间 发 送 的 TCP 报 文 段 流 中 揪 
入 、 删 除 和 代替 报 文 段 的 能 力 。 例 如 ，Trudy 能 够 俘获 由 Bob RIX APH PAIR ICEL, BRIX 
两 个 报 文 段 的 次 序 ， 调 整 TCP 报 文 段 的 序号 (这 些 未 被 加 密 ) ， 然 后 将 这 两 个 次 厅 翻 转 的 
报 文 段 发 送 给 Alice, 假定 每 个 TCP 报 文 段 正好 封装 了 一 个 记录 ， 我 们 现在 看 看 Alice 将 如 
何 处 理 这 些 报 文 段 . 

1 ) 在 Alice 端 运行 的 TCP 将 认为 一 切 正 常 ， 将 这 两 个 记录 传递 给 SSL 于 层 . 

2) 在 Alice wight) SSL RF AE RR PY Tic - 

3) 在 Alice 端的 SSL 将 使 用 在 每 个 记录 中 的 MAC 来 验证 这 两 个 记录 的 数据 完整 性 

4) 然后 SSL 将 解密 的 两 条 记录 的 字 节 流传 递 给 应 用 层 ; 但 是 Alice WCB AY SE EF D i 
FA Fick hI a CB) TTT Ce AS TE W! 

RE A WEY ye, U4 Trudy 删除 报 文 段 或 当 Trudy 重 放 报 文 段 时 。 

对 该 问题 的 解决 方案 如 你 可 能 猜想 的 那样 ， 那 就 是 使 用 序号 、SSL 采用 如 下 的 方式 . 
Bob 维护 一 个 序号 计数 器 ， 计 数 咒 开始 为 0，Bob 每 发 送 的 一 个 SSL 记录 它 部 增加 1。Bob 
并 不 实际 在 记录 中 包括 一 个 序号 ， 但 当 他 计算 MAC 时 ， 他 把 该 序号 包括 在 MAC 的 计算 
H. 所 以 ,该 MAC 现在 是 数据 加 MAC 密 钥 M, 加 当前 序号 的 散 列 。Alice 跟 踊 Bob AJJIF 
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号 ， 通 过 在 MAC 的 计算 中 包括 适当 的 序号 ， 使 她 验证 一 条 记录 的 数据 完整 性 。SSL FG 
的 使 用 阻止 了 Trudy 执行 诸如 重 排序 或 重 放 报 文 段 等 中 间 人 攻击 。( 为 什么 ?) 
4. SSL ida 
SSL 记录 (以 及 类 SSL 记录 ) 显示 在 图 8-26 中 。 该 记录 由 类 型 字段 、 版 本 字段 、 长 
. ARETE sk MAC 字段 组 成 . 注意 到 前 三 个 字段 是 不 加 密 的 。 类 型 字段 指出 了 该 
serves eres 1J 含 应 用 数据 的 报 文 上 也 用 于 关闭 SSL 连接 ， 如 下 面 所 讨论 。 在 接 
BN 的 SSL 使 用 长 度 字段 加 从 到 达 的 TCP 字 节 流 中 提取 SSL 记录 。 版 本 字段 是 自 解释 的 。 


类 型 版 本 长 度 数据 MAC 


用 E; 加 密 


图 8-26 SSL 记录 格式 


8. 6.2 更 完整 的 描述 


前 一 小 节 涉 及 了 类 SSL 协议 ; 其 目的 是 让 我 们 对 SSL 的 工作 原理 和 工作 过 程 有 一 人 
本 理解 ， 既然 我 们 已 经 对 SSL 有 上 了 了 ek CTE A BES A HE WEE SK Por SSL a i 
T- 为 了 配合 阅读 对 SSL PPI ANS A, EA eN Wireshark SSL 实验 ， 它 在 本 书 配 套 
的 Web 网 站 上 可 供 使 用 . 

1. SSL 握手 

SSL 并 不 强制 Alice 和 Bob 使 用 一 种 特定 的 对 称 密 钥 算法 、 一 种 特定 的 公 钥 算法 或 一 
种 特定 的 MAC. FAIZ. SSL 允许 Alice 和 Bob 在 握手 阶段 在 SSL 会 话 开 始 时 就 密码 算法 取 
得 一 致 。 此外， 在 握手 阶段 ，Alice 和 Bob 彼此 发 送 不 重 数 ， 该 数 被 用 于 会 话 密 钥 (Ep, 
Mp, i ALM,) 的 生成 中 。 真正 的 SSL 握手 的 步骤 如 下 : 

) 客户 发 送 它 支持 的 密码 算法 的 列表 ， 连 同一 个 客户 的 不 重 数 。 

从 该 列表 中 ， 服 务 需 选择 一 种 对 称 算 法 (例如 AES) 、 一 种 公 钥 算法 (例如 有 具有 
特定 密 钥 长 度 的 RSA) 和 一 种 MAC BIE. 它 把 它 的 选择 以 及 证 书 和 一 个 服务 硕 不 重 数 返 
回 给 客户 - 

3) 客户 验证 该 证 书 ， 提 到 服 务 硕 的 公 铀 ， 生 成 一 个 前 主 密 钥 (Pre- Master Secret, 
PMS) ， 用 服务 器 的 公 钥 加 密 该 PMS， 并 将 加 密 的 PMS 发 送 给 服务 器 。 

4) 使 用 相同 的 密 钥 导出 男 数 (就 像 SSL 标准 定义 的 那样 ) ， 客 户 和 服务 器 独立 地 从 
PMS 和 不 重 数 中 计算 出 主 密 钥 (Master Secret, MS), Ja iZ MS 被 切片 以 生成 两 个 密码 和 
两 个 MAC WEH. 此外， 当选 择 的 对 称 密码 应 用 于 CBC (例如 3DES 或 AES) ， 则 两 个 初始 
化 向 量 (Initialization Vector, IV) 也 从 该 MS 获得 ， 这 两 个 TIV 分 别 用 于 该 连接 的 两 端 。 自 
此 以 后 ， 客 户 和 服务 费 之 间 发 送 的 所 有 报 文 均 被 加 帘 和 鉴别 (使 用 MAC ) 。 

5) 客户 发 送 所 有 握手 报 文 的 一 个 MAC. 

6) 服务 器 发 送 所 有 握手 报 文 的 一 个 MAC 

最 后 两 个 步骤 使 操 手 免 受 算 改 危害 。 为 了 理解 这 一 点 ， 观 察 在 第 一 步 中 ， 客 户 通常 提 
供 一 个 算法 列表 ， 其 中 有 些 算 法 强 ， 有 些 算法 弱 。 因 为 这 些 加 密 算法 和 窗 钥 还 没有 被 协商 
好 ， 所 以 算法 的 这 张 列表 以 明文 形式 发 送 。Trudy 作为 中 间 人 ， 能 够 从 列表 中 删除 较 强 的 
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PIA, ie PAER RS IA. OA SWRA, EPRS 中 客户 发 送 一 个 
级 联 它 已 发 送 和 接收 的 所 有 握手 报 文 的 MAC， 服 务 器 能 够 比较 这 个 MAC 与 它 已 接收 和 发 
送 的 握手 报 文 的 MAC, Wey ANB, IRA A HEE LiKE. FW, We A AIK 
个 它 已 经 看 到 的 握手 报 文 的 MAC， 人 允许 客户 检查 不 一 致 性 。 

你 可 能 想 知 道 在 步骤 1 和 步 桑 2 中 存在 不 重 数 的 原因 。 订 二 不 足以 防止 报 文 段 重 放 攻 
击 吗 ?答案 是 肯定 的 ， 但 它们 并 不 只 是 防止 “连接 重 放 攻击 ”。 考虑 下 列 连接 重 放 攻 击 
假设 Trudy IFR F Alice 和 Bob 之 间 的 所 有 报 文 。 第 二 天 ， Trudy 冒充 Bob Jf jo] Alice 发 送 
正好 是 前 一 天 Bob joj Alice 发 送 的 相同 的 报 文 厅 列 。 如 果 Alice 没有 使 用 不 重 数 ， 她 将 以 前 
一 天 发 送 的 完全 相同 的 序列 报 文 进行 啊 应 。Alice 将 不 怀疑 任何 不 规矩 的 事 ， 央 为 她 接收 
到 的 每 个 报 文 将 通过 完整 性 检查 .如果 Alice 是 一 个 电子 商务 服务 带 ， 她 将 认为 Bob 正在 
进行 第 二 次 订购 (正好 订购 相同 的 东西 )。 在 为 一 方面 ， 在 协议 中 包括 了 一 个 不 重 数 ， 


Alice 将 对 每 个 TCP 会 话 发 送 不 同 的 不 重 数 ， 使 得 这 plep 不 站 ik, “4 Alice 
接收 到 来 自 Trudy 重 放 的 SSL 记录 时 ， 该 记录 将 无 法 通过 完整 性 检查 ，、， 并 且 假 崩 的 电子 商 


务 事务 将 不 会 成 功 . 总 而 言 之 , 在 SSL 中 ， 不 重 数 用 于 防御 “ 连 ae , MS HP 
御 在 一 个 进行 中 的 会 话 中 重 放 个 别 分 组 ， 

2. 连接 关闭 

在 某 个 时 刻 ，Bob 或 者 Alice 将 要 终止 SSL 会 话 。 一 个 方法 是 让 Bob 通过 直接 终止 底 
层 的 TCP 连接 来 结束 该 SSL 会 话 ， 这 就 是 说 ， 通 过 让 Bob 向 Alice 发 送 一 个 TCP FIN 报 文 
涩 ， 但 是 这 种 幼稚 设计 为 截断 攻击 (truncation attack ) T ATF, Trudy 再 一 次 介入 

个 进行 中 的 SSL 会 话 中 ， 并 用 TCP FIN 过 早 地 结束 了 该 会 话 。 如 果 Trudy 这 样 做 的 话 ， 

Alice 将 会 认为 她 收 到 了 Bob 的 所 有 数据 ， 而 实际 上 她 仅 收 到 了 其 中 的 一 部 分 。 对 这 个 问 
题 的 解决 方法 是 ， 在 类 型 字段 中 指出 该 记录 是 否 是 用 于 终止 该 SSL 会 话 的 。( 尽管 SSL 类 
型 是 以 明文 形式 发 送 的 ， 但 在 接收 方 aj 了 记录 的 MAC 对 它 进 行 了 鉴别 .) 通过 包括 这 样 
一 个 字段 ， 如 果 Alice 在 收 到 一 个 关闭 SSL 记录 之 前 突然 收 到 了 一 个 TCP FIN， 她 可 能 知 
道 正 在 进行 着 某 些 机 花招 的 事情 ， 

到 此 为 止 完成 了 对 SSL 的 介绍 。 我 们 已 经 看 到 它 使 用 了 在 8.2 节 和 8.3 节 讨 论 的 许多 
密码 学 原则 和 希望 更 深入 地 探讨 SSL 的 读者 可 以 阅读 Rescorla 的 有 关 SSL 的 可 读 性 很 强 的 
书籍 | Rescorla 2001 | . 


8.7 网 络 层 安全 性 : IPsec 和 虚拟 专用 网 


IP 安全 (IP Security) 协议 更 背 被 称 为 IPsec， 它 为 网 络 层 提 供 了 了 安全 性 ，IPsec 为 任 
意 两 个 网 络 层 实体 (La EBL ALR TH a) 之 间 的 下 数据 报 提供 了 安全 ， 如 我 们 很 快要 搞 
述 的 那样 ， 许 多 机 构 (公司 、 政 府 部 门 、 非 营利 组 织 等 等 ) 使 用 IPsec 创建 了 运行 在 公共 
因特网 之 上 的 虚拟 专用 网 (virtual private network, VPN). 

在 学 习 [IPsec 细节 之 前 ， 我们 后 退 一 步 来 考虑 为 网 络 层 提供 机 密 性 所 包含 的 意义 。 在 
网 络 实体 对 之 间 〈 例 如 ， 两 侣 路 由 硕 之 间 ， 两 台 主 机 之 间 ， 或 者 路 由 融和 主机 之 问 ) 具有 
网 络 层 机 蜜 性， 发 送 实体 加 密 它 发 送 给 接收 实体 的 所 有 数据 报 的 载 荷 。， 这 种 载 何 可 以 是 一 
个 TCP 报 文 段 、 一 个 UDP 报 文 段 、 一 个 ICMP 报 文 等 等 。 如 果 这 样 的 网 络 层 服 务 适 当 的 
话 ， 从 一 个 实体 向 其 他 实体 发 送 的 所 有 数据 报 将 隐形 于 任何 可 能 咒 探 该 网 络 的 第 三 方 ， 发 
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送 的 数据 报 包 括 电 子 邮 件 、Web 网 页 、TCP 握手 报 文 和 管理 报 文 (例如 ICMP Al SNMP ) 
正 因为 如 此 ， 网 络 层 安全 性 被 认为 提供 了 了 “地毯 覆盖 ”. 

除了 机 密 性 ， 网 络 层 安 全 协议 潜在 地 能 够 提供 其 他 安全 性 服务 。 例 如 ， 它 能 提供 源 鉴 
别 ， 使 得 接收 实体 能 够 验证 安全 数据 报 的 源 。 网 络 层 安全 协议 能 够 提供 数据 完整 性 ， 使 得 
接收 实体 能 够 核对 在 数据 报 传输 过 程 中 可 能 出 现 的 任何 算 改 。 网 络 层 安全 服务 也 能 提供 防 
止 重 放 攻 击 功 能 ， 这 意味 看 Bob 能 够 检测 任何 攻击 者 可 能 插入 的 任何 元 余数 据 报 。 我 们 将 
很 快 看 到 IPsec 的 确 提 供 了 用 于 这 些 安全 服务 的 机 制 ， 即 机 密 性 、 源 鉴别 、 数 据 完整 性 和 
重 放 攻击 防护 . 


8.7.1 IPsec 和 虚拟 专用 网 


跨越 在 多 个 地 理 区 域 上 的 某 机 构 常 常 希望 有 自己 的 IP 网络， 使 它 的 主机 和 服务 涡 能 
够 以 一 种 安全 和 机 和 密 的 方式 彼此 发 送 数 据 ，。 为 了 达到 这 个 目标 ,该 机 构 能 够 实际 部 竹 一 个 
a 独 的 物理 网 络 ， 该 网 络 包 括 路 由 器 、 链 路 和 DNS J ahi H Bg ZS SE ALE SE ep Be 
这 样 一 种 为 特定 的 机 构 专 用 的 分 立 网 络 被 称 为 专用 网 络 (privale network). AN ATR, E 
用 网 络 可 能 耗 帝 巨大 ， 因 oe BEM. ACR ARIE A C AY ey EE R SE hi. 
Ax |e] Fk AEG SAEM, Oi LS ZEB AY ZS SE ee) aE VPN 使 
用 VPN, ， 机 构 办 公 eg -独立 的 网 络 发 送 ， 而 为 了 提 
供 机 密 性 ， 办 公 室 之 间 的 流量 在 进入 公共 因特网 之 前 进行 加 密 . 图 8-27 中 显示 了 VPN 的 
一 个 简单 例子 。 这 里 的 机 构 由 一 个 总 部 、 一 个 分 文 届 构 和 旅行 中 的 销售 员 组 成 ， 销售 员 通 
贡 从 他 们 的 旅馆 房间 接 人 因特网。 (在 该 图 中 仅 显 示 了 一 名 销售 员 .) 在 这 个 VPN 中 ， 无 
论 何 时 ， 位 于 总 部 的 两 台 主 机 相互 发 送 IP 数据 报 或 位 于 分 支 机 构 的 两 台 主 机 要 通信 ， 它 
们 都 使 用 经 典 的 [Pv4 (BFC IPsec 服务 ) 。 然 而 ， 当 两 台 机 构 的 主机 经 过 跨越 公共 因特网 
的 路 径 时 ， 这 些 流 量 在 进入 因特网 之 前 进行 加 密 ， 
有 具有 IPsec 的 便携 机 
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为 了 感受 VPN 的 工作 过 程 ， 我们 浏览 图 8-27 Gee PI ie I. SU P A 
台 主 机 回 某 旅馆 中 的 某 销售 员 发 送 一 个 IP 数据 报时 ， 总 部 中 的 网 关 路 由 器 将 经 典 的 IPv4 
转换 成 为 IPsec 数据 报 ， 然 后 将 该 IPsec 数据 报 转发 进 因 特 网 。 该 IPsec 数据 报 实际 上 有 具有 
传统 的 IPv4 首部 ， 因 此 在 公共 因特网 中 的 路 由 需 处 理 该 数据 报 ， 仿 佛 它 对 路 由 郑 而 言 是 
一 个 普通 的 [Pv4 数据 报 。 但 是 如 8-27 所 示 ，IPsec 数据 报 的 载 向 包括 了 一 个 IPsec Hi, 
该 首部 被 用 于 IPsec 处 理 ; HESR, IPsec 数据 报 的 载 向 是 被 加 密 的 。 当 该 IPsec 数据 报到 达 
销售 员 的 便携 机 时 ， 便 携 机 的 操 人 (并 提供 其 他 安全 服务 ， 如 验证 数据 完整 
性 ) ， 并 将 解密 的 载荷 传递 给 上 层 协议 〈 例 如 ,给 TCP 或 UDP) .。 
我 们 刚刚 给 出 了 了 潜 机 构 能 够 应 用 IPsec 生 ra VPN 的 高 层面 的 展望 。 为 了 通过 局 部 
看 全 局 ， 我 们 已 经 去 掉 了 许多 重要 的 细节 。 现 在 我 们 来 进行 更 深入 的 学 习 。 


8.7.2 AH 协议 和 ESP 协议 


IPsec 是 一 个 相当 复杂 的 整体 ， 即 它 被 定义 为 10 多 个 RFC 文档 。 两 个 重要 的 文档 是 
RFC 4301 和 RFC 6071， 前 者 描述 了 总 体 IP 安全 体系 结构 ， 后 者 提供 了 一 个 IPsec 协议 集 
的 概述 。 在 本 教科 书 中 我 们 的 目标 与 往常 一 样 ， 并 不 只 是 一 味 重 复 顶 燥 和 星 深 难 解 的 RFC 
文档 ， 而 是 采用 一 种 更 具 可 操作 性 和 易于 教学 的 方法 来 描述 协议 。 

在 IPsec 协议 族 中 ， 有 两 个 主要 协议 : 鉴别 首部 (Authentication Header, AH) 协议 和 
封装 安全 性 载荷 (Encapsulation Security Payload, ESP) 协议 。 当 某 源 IPsec 实体 (通常 是 
一 台 主 机 或 路 由 硕 ) 同一 个 目的 实体 〈 通 第 也 是 一 人 台 主 机 或 路 由 疮 ) 发 送 安 全 数据 报时 ， 
它 可 以 使 用 AH 协议 或 ESP 协议 来 做 到 。AH 协议 提供 源 鉴别 和 数据 完整 性 服务 ， 但 不 提 
供 机 密 性 服务 。ESP 协议 提供 了 源 鉴 别 、 数 据 完整 性 和 机 密 性 服务 。 因 为 机 密 性 通常 对 
VPN 和 其 他 IPsec 应 用 是 至 关 重 要 的 ， 所 以 ESP 协议 的 使 用 比 AH 协议 要 广泛 得 多 。 为 了 
讲 清 IPsec 并 且 避 免 许多 难题 ， 我 们 将 此 后 专门 关注 ESP HX. Bea Ae J AH 协议 的 
读者 研讨 相关 的 RFC 和 其 他 在 线 资源 。 


8.7.3 安全 关联 


IPsec 数据 报 在 网 络 实体 对 之 间 发 送 ， 例 如 两 台 主 机 之 间 、 两 台 路 由 器 之 间或 一 台 
机 和 一 台 路 申 融 之 间 。 在 从 源 实体 回 目 的 实体 发 送 IPsec lit 源 和 目的 实体 创建 
1 ARR as 这 个 逻辑 连接 称 为 安全 关联 (Security Association, SA), 一 个 
SA 是 一 个 单 工 逻辑 连接 ; 也 就 是 说 ， 它 是 从 源 到 目的 地 单 回 的 。 如 果 两 个 实体 要 互相 发 
送 安全 数据 报 ， 则 需 创 建 两 个 SA， 每 个 方 回 一 个 : 

例如 ， 再 次 考虑 图 8-27 中 那个 机 构 的 VPN. 该 机 构 由 一 个 总 部 、 一 个 分 支 机 构 和 nn 
个 旅行 销售 员 组 成 。 为 了 举例 的 缘故 ， 我 们 假设 在 总 部 和 分 支 机 构 之 间 有 双 回 IPsec 流量 ， 
并 且 总 部 和 销售 员 之 间 也 有 双 回 IPsec 流量 。 在 这 个 VPN 中 ， 有 多 少 个 SA WE? 为 了 回答 
这 个 问题 ， 注意 到 在 总 部 网 关 路 由 器 和 分 支 机 构 网 关 路 由 器 之 间 有 两 个 有 一 个 方 风 = 


个 ); 对 每 个 销售 员 的 便携 机 而 言 ， 在 总 部 网 关 和 便携 机 之 间 有 两 个 SA ( 仍 是 一 个 方 同一 
A). 因此， 总 计 为 (2+2n) NSA, 然而 记 住 ， 并 非 从 网 关 路 由 器 或 便携 机 发 送 进 因 特 


ae Pe i 量 都 将 是 IPsec 安全 的 。 例如 ， 总 部 中 的 一 台 主 机 可 能 要 访问 公共 因特网 中 的 
革 Web ARH Ae 〈 例 如 Amazon 或 谷歌 ) 。 因 此 ， 该 网 关 路 由 需 (或 该 便携 机 ) 将 发 送 经 典 
的 IPv4 数据 报 和 安全 的 IPsec 数据 报 进 入 因特网 . 
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总 部 分 支 机 构 
Internet 
200.168.1.100 193.68.2.23 
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bial 172.16.2/24 


图 8-28 M RI 到 R2 的 安全 关联 


“我们 现在 观察 SA 的 “内 部 ”为 了 使 讨论 明确 和 具体， 我 们 在 图 8-28 中 的 一 个 从 路 
Hat Rl FPR A ae R2 的 SA 场景 下 进行 观察 (你 能 够 认为 路 由 需 RI 是 图 8-27 中 的 总 部 
网 关 路 由 器 ， 而 路 由 顺 R2 是 图 8-27 中 的 分 文 机 构 网 关 路 由 需 .) RA a RI 将 维护 有 关 该 
SA 的 状态 信息 ， 这 将 包括 : 

e SA 的 32 比特 的 标识 伯 ， 称 为 安全 参数 索引 (Security Parameter Index, SPI). | 

e SA 的 初始 接口 (在 此 例 中 为 200. 168.1.100) 和 SA 的 目的 接口 (在 此 例 中 为 

193. 68. 2. 23). 

o 将 使 用 的 加 密 类 型 (例如 ， 具 有 CBC fy 3DES) . 

e 加 密 密 钥 ， 

e 完整 性 检查 的 类 型 (例如 ， 有 具有 MDS 的 HMAC) 

e 鉴别 密 钥 ， 

无 论 何 时 路 由 器 RI 需要 构建 一 个 IPsec 数据 报 经 过 这 个 SA 转发 ， 它 访问 该 状态 信息 
以 决定 它 应 当 如 何 鉴别 和 加 密 该 数据 报 。 类 似 地 ， 路 由 器 R2 将 维护 对 此 SA 的 相同 的 状 
态 信息 ， 并 将 使 用 该 信息 鉴别 和 加 密 任 何 从 该 SA 到 达 的 IPsec 数据 报 

一 个 IPsec 实体 (路 由 器 或 主机 ) 经 常 维护 许多 SA 的 状态 信息 。 例 如 ， 在 图 8-27 中 
具有 nn 个 销售 员 的 VPN 例子 中 ， 总 部 网 关 路 由 需 维 护 (2 +2n) 个 SA 的 状态 信息 。 一 个 
IPsec 实体 在 它 的 安全 关联 数据 库 (Security Association Database, SAD) 中 存储 其 所 有 SA 
的 状态 信息 ，SAD 是 实体 操作 系统 内 核 中 的 一 个 数据 结构 。 


8.7.4 IPsec 数据 报 


在 描述 了 SA 后 ， 我 们 现在 能 够 描述 实际 的 IPsec 数据 报 了。IPsec 有 两 种 不 同 的 分 组 
形式 ,一 种 用 于 所 谓 隧道 模式 (tunnel mode )， 男 一 种 用 于 所 请 运 输 模 式 (transport 
mode) 。 更 为 适合 VPN 的 隧道 模式 比 运输 模式 部 署 得 更 为 广泛 .为 了 进一步 讲 清 IPsec 和 
避 倪 许多 难题 ， 我 们 因此 专门 关注 隧道 模式 。 一 旦 已 经 牢 牢 地 和 苞 握 了 隧道 模式 ， 应 当 能 够 
容易 地 目 学 运输 模式 。 

IPsec 数据 报 的 分 组 格式 显示 在 图 8-29 中 。 你 也 许 认 为 分 组 格式 是 枯燥 乏味 的 ， 但 我 
们 将 很 快 看 到 IPsec 数据 报 实际 上 尝 起 来 像 美式 墨西哥 风味 (Tex- Mex) 美食 ! 我 们 考察 
图 8-28 的 场景 中 的 IPsec 字段 。 假 设 路 由 融 RI 接收 到 一 个 来 日 主机 172.16.1.17 (在 总 部 
网 络 中 ) 的 普通 IPv4 数据 报 ， 该 分 组 的 目的 地 是 主机 172. 16. 2. 48 (在 分 支 机 构 网 络 中 ). 
MHAE RI 使 用 下 列 方法 将 这 个 “普通 IPv4 数据 报 ” 转换 成 一 个 IPsec 数据 报 : 

e 在 初始 IPv4 数据 报 ( 它 包括 初始 站 部 字段 1) 后 面 附 上 一 个 “ESP 尾部 ”字段 
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。 使 用 算法 和 由 SA 规定 的 密 钥 加 密 该 结果 
e 在 这 个 加 密 量 的 前 面 附加 上 一 个 称 为 “ESP 首部 ”的 字段 ; 得 到 的 包 称 为 “enchi- 
lada”( 以 辣椒 调味 的 一 种 黑 西 如 菜 . 译 者 注 ). 


o 使 用 算法 和 由 SA 规定 的 帘 钥 生成 一 个 覆 六 整 个 enchilada 的 鉴别 MAC. 
e jZ% MAC 附加 到 enchilada 的 后 面 形 成 载荷 . 
e 最 后 ， 生 成 一 个 县 有 所 有 经 盟 1Pv4 痛 部 字段 (通常 共 WRK) 的 全 新 中 首部， 
沪 新 首部 附加 到 载荷 之 前 : 
Ay KEG AY “enchilada” 


被 加 密 





418-29 IPsec 数据 报 格式 


注意 到 得 到 的 IPsec 数据 报 是 一 个 货真价实 的 IPv4 数据 报 ， 它 具有 传统 的 IPv4 首部 字 
屋 后 跟 一 个 载荷 。 但 在 这 个 场合 ， 该 载荷 包含 一 个 ESP 首部 、 初 始 IP 数据 报 、 一 个 ESP 
尾部 和 一 个 ESP 鉴别 字 段 (县 有 加 密 的 初始 数据 报 和 ESP 尾部 ) .初始 的 下 数 据 报 具有 
源 IP 地 址 172. 16. 1. 17 和 目的 地 址 172. 16. 2. 48 .因为 IPsec 数据 报 包 括 了 了 该 初始 IP 数据 
报 ， 这 些 地 址 被 包含 和 被 加 密 作 为 IPsec 分 组 负载 的 组 成 部 分 - 但 是 在 新 IP 首部 中 的 源 和 
目的 地 IP 地 址 ， 即 在 IPsec 数据 报 的 最 左 侧 首部 又 该 如 何 处 理 呢 ? 如 你 所 猜测 ， 它 们 被 设 
置 为 位 Wo 个 站 oo 和 目的 地 路 由 器 接口 ， 也 就 是 200. 168. 1. 100 和 193. 68. 2. 23 
同时 ， 这 个 新 IPv4 首部 字段 中 的 协议 号 不 被 设置 为 TCP、UDP 或 SMTP， 而 是 设置 为 50， 
指示 这 是 一 个 使 用 ESP sera IPsec 数据 报 。 

{E RI 将 TPsec 数据 报 发 送 进 公共 因特网 之 后 ， 它 在 到 达 R2 之 前 将 通过 许多 路 由 天 。 
这 些 路 由 锅 中 的 每 个 将 处 理 该 数据 报 ， 就 像 它 是 一 个 普通 数据 报 一 样 ， 即 它们 被 完全 起 记 
这 样 的 事实 : 该 数据 报 正在 承载 IPsec 加 密 的 数据 。 对 于 这 些 公 共 因 特 网 路 由 闫 ， 因 为 在 
外 面 首部 中 的 目的 IP 地 址 是 R2 ， 所 以 该 数据 报 的 最 终 目的 地 是 R2. 

在 考察 了 如 何 构造 一 个 IPsec 数据 报 的 例子 后 ， 我 们 现在 更 仔细 地 观察 enchilada 的 | 
成 。 我们 看 到 在 图 8-29 中 的 ESP 尾部 由 三 个 字段 组 成 : HE., MERKEA TF iH 
前 面 讲 过 块 密码 要 求 被 加 密 的 报 文 必 须 为 块 长 度 的 整数 倍 。 使 用 十 充 (由 无 意义 的 字 
成 ) ， 使 得 当 其 加 上 初始 数据 报 (连同 填充 长 度 字 段 和 下 一 个 首部 字段 ) 形成 的 “ 报 文 ” 
是 块 的 整数 倍 ， 填 充 长 度 字 段 指示 接收 实体 搬入 的 填充 是 多 少 (并 且 需 要 被 删除 ) 。 下 一 
个 首部 字段 指示 包含 在 载 集 数据 字段 中 数据 的 类 型 (例如 UDP)。 载 傈 数据 〈 通 向 是 初始 
IP 数据 报 ) A ESP 尾部 级 联 起 来 并 被 加 密 ， 

附加 到 这 个 加 密 单 元 前 面 的 是 ESP 首部 ， 该 首部 以 明文 发 送 ， 它 由 两 个 字段 组 成 : 
SPI 字段 和 序号 字段 ，SPI 字段 指示 接收 实体 该 数据 报 属 于 哪个 SA; 接收 实体 则 能 够 用 该 
SPI 索引 其 SAD 以 确定 适 当 的 鉴别 /解密 算法 和 密 钥 ， 订 号 字段 用 于 防御 重 放 攻击 - 
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发 送 实体 也 附加 一 个 鉴别 MAC 如 前 所 述 ， 发 送 实 体 跨 越 整个 enchilada (由 ESP 首 
mb. Pea IP 数据 报 和 ESP 尾部 组 成 ，、 即 具有 加 密 的 数据 报 和 尾部 ) 计算 一 个 MAC- 前 面 
进 过 为 了 计算 一 个 MAC， 发 送 方 附加 一 个 秘密 MAC 密 钥 到 该 enchilada， 进 而 计算 该 结果 
的 一 个 固定 长 度 获 列 . 

“4 R2 接收 到 IPsec 数据 报时 ，R2 看 到 该 数据 报 的 目的 吓 地 址 是 R2 H. R2 因此 处 
理 该 数据 报 。 因 为 协议 字段 (位 于 IP 首部 最 左 侧 ) 是 50，R2 明白 应 当 对 该 数据 报 施 加 
IPsec ESP 处 理 ， 第 一 ， 针 对 enchilada, R2 使 用 SPI 以 确定 该 数据 报 属于 哪个 SA。 第 二 ， 
它 计 算 该 enchilada 的 MAC 并 且 验 证 该 MAC 与 在 ESP MAC 字段 中 的 值 一 致 。 如 果 了 两 者 一 
致 ， 它 知道 该 enchilada KA RI 并 且 未 被 算 改 ， 第 三 ， 它 检查 序号 字段 以 验证 该 数据 报 是 
新 的 (并 且 不 是 重 放 的 数据 报 )， 第 四 ， 它 使 用 与 SA 关联 的 解密 算法 和 密 钥 解密 该 加 密 
单元 - 第 五 ， 它 删除 填充 并 抽取 初始 的 普通 IP 报 文 。 最 后 ， 它 朝 看 其 最 终日 的 地 将 该 初 
始 数 括 报 转发 进 分 文 机 构 网 络 。 这 个 一 种 多 么 复杂 的 秘诀 呀 ! 还 未 曾 有 人 声称 准备 并 破解 
enchilada Ai — (“+ Z 54 AY SE! 

实际 上 还 有 为 一 个 重要 的 细微 差别 需要 处 理 。 它 以 下 列 问 题 为 中 心 : 当 Rl 从 位 于 总 
部 网 络 中 的 一 台 主 机 收 到 一 个 〈 未 加 密 的 ) 数据 报时 ， 并 且 该 数据 报 目的 地 为 总 部 以 外 的 
条 个 目的 IP Sih. R2 怎样 才能 知道 它 应 当 将 其 转换 为 一 个 IPsec 数据 报 呢 ? JF ARE 
由 IPsec 处 理 ，R1 如 何 知 道 它 应 当 使 用 (在 其 SAD 中 的 许多 SA 中 ) 哪个 SA 来 构造 这 1 
IPsec 数据 报 呢 ”该 问题 以 如 下 方式 和 解决。 除了 SAD 9h, IPsec 实体 也 维护 另 一 个 数据 结 
i, ERR ARS REE (Security Policy Database, SPD). 该 SPD 指示 哪些 类 型 的 数据 报 
(作为 源 了 下 地址 、 目 的 IP dak AIMN AY AY eK BC) 将 被 IPsec 处 理 ; 并 且 对 这 些 将 被 
[Psec 处 理 的 数据 报应 当 使 用 哪个 SA。 从 某 种 意义 上 讲 ， 在 SPD 中 的 信息 指示 对 于 一 个 到 
达 的 数据 报 做 “什么 ; E SAD 中 的 信息 指示 “怎样 ”去 做 。 

IPsec 服务 的 小 结 

IPsec 究竟 提供 什么 样 的 服务 呢 7 我 们 从 某 攻击 者 Trudy 的 角度 来 考察 这 些 服务 ，Trudy 
是 一 个 中 间 人 ， 位 于 网 8-28 P RI 和 R2 之 间 路 径 上 的 某 处 。 假设 通过 这 些 讨 论 ，Trudy 不 知 
首 SA 所 使 用 的 鉴别 和 加 密 密 钥 。Trudy 能 够 做 些 什 么 和 不 能 够 做 些 什么 呢 ? 第 一 ，Trudv 不 
能 看 到 初始 数据 报 。 如果 事实 如 此 ,不仅 Trudy 看 不 到 在 初始 数据 报 中 的 数据 ， 而 且 也 看 不 
到 协议 号 、 源 IP 地 址 和 目的 IP 地 址 。 对 于 经 该 SA 发 送 的 数据 报 ，Trudy 仅 知 道 该 数据 报 源 
于 172. 16. 1. 0/24 的 某 台 主机 以 及 目的 地 为 172. 16. 2. 0/24 AEG EAL. bb RAE EAE 
ay TCP, UDP ok ICMP 数据 ; 她 不 知道 它 是 否 携 市 了 HTTP, SMTP 或 某 些 其 他 类 型 的 应 用 程 
Tr Rie. 因此 这 种 机 蜜 性 比 SSL 泄 围 更 为 宽广 . 第 二 ，Trudy 试图 用 反 转 数据 报 的 某 些 比特 
KELME SA 中 的 某 个 数据 报 ， 当 a a 到 过 R2 时 ， 它 将 难以 通过 完整 性 核查 (使 
用 MAC) ， 再 次 挫败 了 Trudy 的 恶意 尝试 。 第 三 ， 假设 Trudy 试图 假冒 RI1， 生 成 一 个 源 为 
200. 168. 1. 100 和 日 的 地 为 193. 68 2 23 的 IPsec 数据 报 o Trudy 的 攻击 将 是 无 效 的 ， 因 为 这 个 
数据 报 将 再 次 通 不 过 在 R2 的 完整 性 核查 。 最 后 ， 因 为 IPsec 包含 序号 ，Trudy 将 不 能 够 生成 
一 个 成 功 的 重 放 攻击 。 总 而 言 之 ， 正 如 本 市 开始 所 言 ，IPsec 在 任何 通过 网 络 层 处 理 分 组 的 
设备 对 之 间 ， 提 供 了 机 蜜 性 、 源 鉴别 、 数 据 完整 性 和 重 放 攻 击 防 护 。 


8.7.5 IKE: IPsec 中 的 密 钥 管理 
当 某 VPN 具有 少量 的 端点 时 (例如 ,图 8-28 中 只 有 两 台 路 由 器 ) ， 网 络 管理 员 能 够 
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在 该 端点 的 SAD PA THA SA 信息 (加密 / 鉴 别 算法 和 密 钥 及 SPI) EEA ATEH 
法 ”对 于 一 个 大 型 YPN 显然 是 不 切实 际 的 ， 因 为 大 型 VPN 可 能 由 成 百 甚至 上 千 台 IPsec 路 
由 融和 主机 组 成 。 大 型 的 、 地 理 上 分 散 的 部 著 要 求 一 个 目 动 的 机 制 来 生成 SA IPsec 使 用 因 
特 网 密 钥 交换 (Internet Key Exchange, IKE) 协议 来 从 事 这 项 工作 ，IKE 由 RFC 5996 定义 
IKE 与 SSL (参见 8.6 节 ) 中 的 握手 具有 某 些 类 似 。 每 个 IPsec 实体 具有 一 个 证 书 ， 
该 证 书包 括 了 该 实体 的 公开 密 钥 。 如 同 使 用 SSL 一 样 ，IKE 协议 让 两 个 实体 交换 证 书 ， 协 
商 鉴 别 和 加 密 算 法 ， 并 安全 地 交换 用 于 在 IPsec SA 中 生成 会 话 密 钥 的 密 钥 材料 ， 与 SSL 不 
同 的 是 ，[KE 应 用 两 个 阶段 来 执行 这 些 任 务 . 
我 们 来 研究 图 8-28 中 两 台 路 由 器 RI 和 R2 场 量 下 的 这 两 个 阶段 ”第 一 个 阶段 由 Rl1 和 
R2 之 回报 文 对 的 两 次 交换 组 成 : 
© 在 报 文 的 第 一 次 交换 期 间 ， 两 侧 使 用 Diffie-Hellman (人 参见 课 后 习题 ) 在 路 用 人 需 之 
国生 成 一 个 双 回 的 IKE SA. 为 了 防止 混 清 ， 这 个 双 回 IKE SA 完全 不 同 于 8. 6.3 
TAL 8. 6.4 节 所 讨论 的 IPsec SA, 该 IKE SA 在 这 两 台 路 由 善之 间 提 供 了 了 一 个 鉴别 
的 和 加 蜜 的 信道 。 在 首 个 报 文 对 交换 期 间 ， 创 建 用 于 下 E SA 的 加 蜜 和 鉴别 的 窜 
钥 。 还 创建 了 将 用 于 计算 后 期 在 阶段 2 使 用 的 IPsec SA 密 钥 的 一 个 主 密 钥 。 观 察 
在 第 一 步骤 期 间 ， 没 有 使 用 RSA 公 钥 和 私 钥 。 特 别 是 ，R1 或 R2 部 没有 通过 用 它 
们 的 私 钥 对 报 文 签字 而 泄露 其 身份 
e 在 报 文 的 第 二 次 交换 期 间 ， 两 侧 通 过 对 其 报 文 签名 而 透漏 了 它们 的 身份 .然而 ， 
这 些 映 份 并 未 透漏 给 被 动 的 串 探 者 ， 因 为 这 些 报 文 是 经 过 安全 的 IKE SA 信道 发 送 
的 。 同 时 在 这 个 阶段 期 间 ， 两 侧 协 商 由 IPsec SA 应 用 的 IPsec 加 密 和 鉴别 算法 . 
在 IKE 的 第 二 个 阶段 ， 两 侧 生 成 在 每 个 方 回 的 一 个 SA。 在 阶段 2 结束 时 ， 对 这 两 个 
SA 的 每 一 侧 都 建立 了 加 密 和 鉴别 会 话 密 钥 。 然后 这 两 侧 部 能 使 用 SA 来 发 送 安 侍 的 数据 
报 ， 如 同 8.7.3 节 和 8.7.4 节 描 述 的 那样 。 在 IKE 中 有 两 个 阶段 的 基本 动机 是 计算 成 本 ， 
即 因为 第 二 阶段 并 不 涉及 任何 公 钥 密码 ，IKE 能 够 以 相对 低 的 计算 成 本 在 两 个 IPsec 实体 
之 则 生成 大 量 SA, 


8.8 使 无 线 LAN 安全 


在 无 线 网 络 中 安全 性 是 特别 重要 的 关注 因素 ， 因 为 这 时 携 审 数据 帧 的 无 线 电波 可 以 传播 
到 远离 包含 无 线 基 站 和 主机 的 建筑 物 以 外 的 地 方 。 在 本 节 中 ， 我 们 简要 介绍 了 无 线 安 全 性 . 
对 于 更 为 深入 地 探讨 ， 参 见 由 Edney 和 Arbaugh 撰写 的 可 读 性 很 强 的 书 [ Edney 2003 | 

在 802. 11 中 的 安全 性 问题 受到 了 技术 界 和 媒体 界 的 极 大 关注 。 在 进行 大 量 讨论 的 同 
时 ， 一 个 几乎 没有 争论 的 事实 是 ， 看 起 来 被 广泛 认同 的 初始 802. 11 规范 具有 一 些 产 重 的 
安全 性 缺陷 。 现 在 的 确 能 够 下 载 利 用 这 些 漏洞 的 公共 域 软件 ， 使 得 那些 使 用 该 普通 802. 11 
安全 性 机 制 的 用 户 面 对 安全 性 攻击 ， 就 像 根 本 没有 使 用 安全 性 措施 的 网 络 用 户 一 样 ， 门 户 
洞开 。 

在 下 面 一 节 中 ， 我 们 讨论 最 初 在 802. 11 规范 中 标准 化 的 安全 性 机 制 ， 该 规范 统称 为 
有 线 等 效 保 密 (Wired Equivalent Privacy, WEP). JPY RASC, WEP 意欲 提供 类 似 于 在 有 线 
网 络 中 的 安全 性 水 平 。 接 下 来 我 们 将 讨论 WEP 中 的 安全 性 漏洞 并 讨论 802. 11i 标准 ， 后 者 
是 在 2004 年 采纳 的 802. 11 的 本 质 上 更 为 安全 的 版 本 ， 
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8.8.1 有 线 等 效 保密 


IEEE 802. 11 的 WEP 协议 设计 于 1999 年 ， 为 在 主机 和 无 线 接 人 点 ( 即 基站 ) 之 间 提 
供 鉴别 和 数据 的 加 密 。WEP 并 没有 指定 密 钥 管理 算法 ,因此 它 假定 主机 和 无 线 技 入 点 之 
癌 通 过 于 外 方式 就 密 钥 达成 了 某 种 一 致 .鉴别 以 下 列 方式 进行 : 

1 ) 无线 主机 通过 接 入 点 请 求 鉴别 。 

2) 接 入 点 以 一 个 128 字 节 的 不 重 数值 啊 应 该 鉴别 请 求 。 

3) 尤 线 主机 用 它 与 这 个 接 入 点 共享 的 密 钥 加 密 这 个 不 重 数值 ， 

4) 接 和 人 点 解密 主机 加 密 的 不 笠 数 但 

如 果 解 密 所 得 不 重 数值 与 初始 发 给 主机 的 值 相 同 ， 则 这 个 接 入 点 鉴别 了 了 该 主机 ， 

图 8-30 阐述 了 了 WEP 数据 加 密 算 法 。 假 定 主机 和 接 入 点 者 知道 一 个 秘密 的 40 比特 对 称 
常 角 人;。 此 外 ， 一 个 24 比特 的 初始 问 量 (IV) 附加 到 这 个 40 比特 的 密 钥 后 面 ， 产 生 用 
于 加 密 单 个 帧 的 一 个 64 比特 密 钥 “每 一 个 帧 所 使 用 的 TV 都 不 同 ， 所 以 每 一 帧 都 由 不 同 的 
64 比特 密 钥 加 密 。 加密 以 如 下 方式 进行 ， 首先 为 每 个 数 记 载 向 计算 一 个 4 字 节 的 CRC 值 
(UL5.2 W), 然后 用 RC4 流 密码 加 密 该 载 何 和 该 4 字 市 CRC。 我们 这 里 不 涉及 RC4 的 细 
六 《细节 参见 | Schneier 1995 | 和 | Edney 2003] ) ， 就 我 们 的 目的 而 言 ， 知 道 下 列 事实 即 
il; 对 于 密 钥 值 (此 时 为 64 比特 (Ks, IV) 密 钥 ) ，RC4 算法 产生 一 个 密 钥 值 的 流 为 后 ， 
ky Ry ,…， 这 些 密码 值 用 于 加 密 一 帧 中 的 数据 和 CRC 值 ， 出 于 实用 的 日 的 ， 我 们 可 以 认 
为 每 次 对 一 个 字 节 执行 这 些 操 作 ， 通过 把 数据 的 第 i 字 节 d, 和 由 (Ks, IV) 对 生成 的 密 铀 
值 流 中 的 第 i 个 密 钥 k 执行 异 或 操作 进行 加 密 ， 以 产生 密 文 的 第 i 字 节 <,: 

c = d, Qk“ 
LV ¢ By they ) 






Ko: 40 比 特 对 称 密 铀 
k^ 


B 
t | i 
明文 帧 数据 加 CRC seed, ds d; + dy CRC, + 
I i | | 
í i : | 
t v v 中 + 
Ci 人 Cy, Sa Cy Cyl 


I<] 8-30 802.11 WEP 协议 


如 图 8-30 中 所 示 ， 该 IV 值 逐 帧 而 变化 ， 以 明文 形式 出 现在 每 一 个 WEP 加 密 的 
802. 11 帧 的 首部 中 - 接收 方 取 它 与 发 送 方 共 享 的 秘密 40 比特 对 称 密 钥 ， 添 加 上 该 IJV， 并 
使 用 形成 的 64 比特 的 密 钥 〈 它 与 发 送 方 执行 加 密 所 用 的 密 钥 相同 ) A ak or 

d = ce ® k` 

正确 使 用 RC4 算法 要 求 同 一 个 64 比特 密 钥 决 不 能 使 用 超过 1 次 。 前面 讲 过 WEP 3H 
是 每 一 帧 变换 一 次 。 对 于 某 给 定 的 天 (如果 它 有 变化 的 话 也 是 很 少 的 ) ， 这 意味 着 只 有 
2 个 不 同 的 密 钥 可 用 。 如 果 随 机 选择 这 些 密 钥 的 话 ， 我 们 能 够 看 到 | Walker 2000; Edney 
2003 | ， 则 仅 在 处 理 12 000 帧 之 后 就 选中 相同 的 JIV 值 (从 而 使 用 相同 的 64 比特 密 钥 ) 的 概 
率 超 过 99% . 在 1KB 帧 长 和 11Mbps 数据 传输 凌 的 情况 下 ， 传 答 12 000 Wi i LRP AY AY Tad 


Ae A 





此 外 ， 由 于 TV TA CEG IE BY ÉE, AS EHEH 7 a SY IV 值 

为 理解 重复 使 用 一 个 密 钥 可 能 出 现 的 几 个 问题 之 一 ， 考 虑 下 面 的 选择 明文 攻击 的 情 
{元 ， 仍 以 Trady 对 Alice 进行 攻击 为 例假 定 Trudy (可 能 使 用 IP 哄骗) 回 Alice 发 出 一 个 
请 求 ( 例如， 一 个 HTTP 或 FTP 请 求 )， 要 求 Alice 传输 内 容 已 知 的 文件 didi, d,d}, 
Trduy 也 观察 到 Alice 发 送 的 已 加 密 数 据 c ,ca ,ce; ,cs,…， 由 于 d; =c; Ok; ， 如 果 在 这 个 人 
式 两 边 同 时 异 或 ， 可 得 到 : 

d Oe = i" 

根据 这 个 关系 ，Trudy 就 可 以 使 用 已 知 的 d, Alc, 值 计算 出 上 ， 下 一 次 Trudy 看 到 使 用 
同一 IV 值 时 ， 她 将 知道 密 钥 流 为 后 ,让 ,h,…*， 并 可 使 用 这 些 密 钥 解密 报 文 

对 于 WEP 还 有 其 他 几 个 值得 关注 的 安全 性 问题 。 | Fluhrer 2001] 描述 了 一 种 攻击 方 
法 ， 盈 当选 择 某 些 弱 密 钥 时 在 RC4 中 暴露 出 的 一 种 已 W195 85. | Stubblefield 2002] 讨论 了 
实现 和 开发 这 种 攻击 的 有 效 方 法 .对 WEP 的 另 一 种 关注 与 在 网 8-30 中 显示 并 在 802. 11 帧 
中 传输 的 用 以 检测 载荷 中 改变 的 比特 的 CRC 比特 有 关 ， 然 而 ， 攻 击 者 在 改变 加 密 内 容 

(例如 用 乱七八糟 的 东西 替代 初始 的 加 密 数据 ) 后 ， 对 这 些 被 替换 的 东西 计算 出 一 个 

CRC， 并 将 该 CRC 放置 在 WEP 帧 中 产生 一 个 将 被 接收 方 接受 的 802. 11 Wi. lade 
是 诸如 我 们 在 8. 3 节 中 学 习 的 报 文 完整 性 技术 来 检测 内 容 算 改 或 蔡 换 。 有关 WEP 安全 性 
E ZAJA, ZuL | Edney 2003; Walker 2000; W eatherspoon 2000 | 及 其 中 的 参考 nt 


0.6.2 IEEE 802. 111 


fE IEEE 802. 11 于 1999 年 发 布 后 不 入， 就 开始 研发 具有 更 强 安全 性 机 制 的 802. 11 geo 
改进 版 本 。 这 个 新 标准 被 称 为 802. 11i ， 于 2004 年 最 终 得 到 批准 ， 如 我 们 将 看 到 的 那样 ， 虽 然 
WEP 提供 了 相对 罚 的 加 密 、 仅 有 单一 方式 执行 鉴别 并 且 没 有 密 钥 分 发 机 制 ， 但 IEEE 802. 11i 
却 提供 了 强 得 多 的 加 密 形 式 、 一 种 可 扩展 的 鉴别 机 制 集合 以 及 一 种 密 钥 分 发 机 制 。 下 而 我 们 

概述 一 下 802. 11i; | TechOnline 2012] 是 一 篇 关于 802. 11i 的 优秀 ( 流 式 音 频 ) 技术 概述 . 
STA: 客户 站 点 


AS: 鉴别 服务 老 


AP: 接 入 点 


’ e 有 线 网 络 
- 
安全 能 力 的 发 现 


P a 


i STA 和 AS 相互 鉴别 ， 共 同 生成 主 密 铀 (MK ) 。AP 作 为 “通道 





(3) sTA 导 出 成 对 主 密 负 (PMK) Saee 3) 
AS 导出 相同 的 PMK 发送 给 AP 


> 一 -一 一 一 一 一 -一 一 一 
STA、AP 使 用 PMK 导 出 用 于 报 文 
加 蜜 、 完 整 性 的 临时 密 钥 CTK ) 
图 8-31 802. 11i: 运行 的 4 个 阶段 
图 8-31 概述 了 802.11i 的 框架 。 除 了 无 线 客 户 和 接 人 点 外 ，802.11i 定义 了 一 台 鉴 别 
RE žr. AP 能 够 与 它 通 信 。 鉴 别 服 务 器 与 AP 的 分 离 使 得 一 台 鉴 别 服务 器 服务 于 许多 AP, 
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集中 在 一 台 服 务 硕 中 作出 有 关 鉴 别 和 接 和 人 GOAR ER) 的 决定 ， 降 低 了 AP 的 成 本 和 复 
ae aie 802. 11i 运行 分 为 4 个 阶段 

) 发 现 。 在 发 现 阶 段 ，AP 通告 它 的 存在 以 及 它 能 够 向 无 线 客 户 结 点 提供 的 鉴别 和 加 

ae 客户 则 请 求 它 布 望 的 特定 鉴别 和 加 密 形 式 。 尽 管 客户 和 AP 已 经 交换 了 报 文 , 但 
ph tt 也 还 没有 加 密 密 钥 ， 因 此 在 该 客户 能 够 通过 无 线 信道 与 任何 远程 主 
a ， 还 需要 进行 几 个 其 他 步 又。 

) FOR RR Foe (MK) 生成 。 鉴别 发 生 在 无 线 客 户 和 鉴别 服务 硕 之 间 。 在 这 个 
阶段 Pre FEA ARATE, CE PAS HD he Ht EAC ATE REE Al HIM 
(Extensible Authentication Protocol, EAP) | RFC 3748] ŒX T ZPR BUR AF He lA] 46 
Ff fay FLAY deg RK ivy PE EH AY oie EU eg FR SCA Sl. AN 8-32 中 所 示 ，EAP 报 文 使 用 
EAPoL (EAP over LAN, [IEEE 802. 1x]) 进行 封装 ， 并 通过 802. 11 无 线 链 路 发 送 。 这 些 
EAP 报 文 在 接 入 点 拆 封 ， 然 后 再 使 用 RADIUS 协议 重新 封装 ， 经 UDP/IP 传输 到 鉴别 服务 
ft. AE RADIUS IIR 4 45 MIPIM | RFC 2865] 并 不 为 802. 111 所 要 求 ， 但 它们 是 802. 11i 
的 事实 上 的 标准 组 件 。 最 近 标 准 化 的 DIAMETER 协议 [ RFC 3588] 很 可 能 在 不 久 的 将 来 
‘AL RADIUS. 

STA: 客户 站 点 


“od or AS: 监 别 服务 器 






FARA, 


图 8-32 EAP 是 一 个 端 到 端 协议 。EAP 报 文 使 用 EAPoL (运行 在 客户 和 接 入 点 之 间 的 无 线 
链 路 上 ) 封装 ， 并 使 用 RADIUS (运行 在 接 入 点 和 鉴别 服务 器 之 间 的 UDPZIP E) 

使 用 EAP， 鉴 别 服务 带 能 够 选择 硅 干 方式 中 的 一 种 来 执行 鉴别 。802. 11i 里 未 强制 一 
种 特殊 的 鉴别 方法 ， 但 经 常 使 用 EAP-TLS 鉴别 方案 [RFC 5216], EAP-TLS 使 用 类 似 于 我 
们 在 8.3 节 中 研究 的 公 钥 技术 (包括 不 重 数 加 密 和 报 文摘 要 )， 以 允许 客户 和 鉴别 服务 需 
彼此 相互 鉴别 ， 并 导出 为 双方 所 知 的 一 个 主 密 钥 。 

3) 成 对 主 密 钥 (Pairwise Master Key, PMK) 生成 。MK 是 一 个 仅 为 客户 和 鉴别 服务 
需 所 知 的 共享 密 钥 ， 它 们 都 使 用 MK 来 生成 一 个 次 密 钥 ， 即 成 对 主 密 钥 (PMK )。 鉴 别 服 
务 器 则 向 AP 发 送 该 PMK, XE :我们 所 希望 这 到 的 目的 ! 客户 和 AP 现在 具有 一 个 共享 
的 密 钥 (前 面 讲 过 在 WEP 中 根本 不 涉及 密 钥 分 发 的 问题 ) ， 并 彼此 相互 鉴别 。 它们 此 时 已 
经 快要 能 发 挥 效用 了 . 

4) 临时 密 钥 (Temporal Key, TK) 生成 。 使 用 PMK ， 无 线 客 户 和 AP 现在 能 够 生成 
附加 的 、 将 用 于 通信 的 密 钥 。 其 中 的 关键 是 临时 密 钥 ，TK 将 被 用 于 执行 经 无 线 链 路 问 任 
意 远 程 主机 发 送 数 据 的 链 路 级 的 加 密 。 

802. 11i 提供 了 几 种 加 密 形 式 ， 其 中 包括 基于 ARS 的 加 密 方案 和 WEP 加密 的 强化 版 本 。 


8.9 运行 安全 性 : 防火 墙 和 入 侵 检测 系统 


遍及 本 章 我 们 已 经 看 出 ， 因 特 网 不 是 一 个 很 安全 的 地 方 ， 即 有 坏 家 伙 出 没 ， 从 事 着 各 种 
各 样 的 破坏 活动 。 给 定 因特网 的 不 利 性 质 ， 我 们 现在 考虑 一 个 机 构 网 络 和 管理 它 的 网 络 管理 
员 。 从 网 络 管理 员 的 角度 看 ， 世 界 可 以 很 明显 地 分 为 两 个 阵营 : 一 部 分 是 好 人 ， 他 们 属于 本 
机 构 网 络 ， 可 以 用 相对 不 受 限 制 的 方式 访问 该 机 构 网 络 中 的 资源 ; 另 一 部 分 是 坏 家 伙 ， 他 们 
是 其 他 一 些 人 ， 访 问 网 络 资源 时 必须 经 过 仔细 审查 。 在 许多 机 构 中 ， 从 中 世纪 的 城堡 到 现代 公 
司 的 建筑 物 ， 都 有 单一 的 出 口 / 人 口 ， 无 论 好 人 坏人 出 人 该 机 构 ， 痢 再 要 进行 安全 检查 。 在 一 
个 城 保 中 ， 可 以 在 帅 桥 的 一 端的 门口 执行 安全 检查 ;在 公司 大 厦 中 、 这 些 工 作 可 在 安全 台 完 成 . 
在 计算 机 网 络 中 ， 当 通信 流量 进入 /离开 网 络 时 要 执行 安全 检查 、 做 记录 、 丢 弃 或 转发 ， 这 些 
工作 都 由 被 称 为 防火 墙 、 和 人 侵 检 测 系统 (IDS) 和 和 人 侵 防 止 系统 CIPS) 的 运行 设备 来 完成 


8.9.1 防火 墙 


防火 墙 (firewall) 是 一 个 人 硬件 和 软件 的 结合 体 ， 它 将 一 个 机 构 的 内 部 网 络 与 整个 因 特 
网 隅 离开 ， 人 允许 一 些 数据 分 组 通过 而 阻止 男 一 些 分 组 通过 . 防火墙 允 许 网 络 管理 员 控 制 外 
部 和 被 管理 网 络 内 部 资源 之 间 的 访问 ， 这 种 控制 是 通过 管理 流入 和 流出 这 些 资 源 的 流量 实 
现 的 。 防 火 墙 具有 3 个 目标 : 
© 从 外 部 到 内 部 和 从 内 部 到 外 部 的 所 有 流量 都 通过 防火 墙 ， 图 8-33 显示 了 一 个 防火 
墙 ， 位 于 被 管理 网 络 和 因特网 其 余部 分 之 间 的 边界 处 。 虽然 许 多 大 型 机 构 可 使 用 
多 级 防火 墙 或 分 布 式 防火 墙 | Skoudis 2006 ] ， 但 在 对 该 网 络 的 单一 接 入 点 处 设置 
一 个 防火 墙 ， 如 图 8-33 中 所 示 ， 这 使 得 管理 和 施加 安全 访问 策略 更 为 容易 ， 
© 仅 被 授权 的 流量 (由 本 地 安全 策略 定义 ) 允许 通过 。 随 大 进入 和 离开 机 构 网 络 的 
所 有 流量 流 经 防火 墙 ， 该 防火 墙 能 够 限制 对 授权 流量 的 访问 。 

e 防火 墙 自身 免 于 渗透 。 防火 墙 自 身 是 一 种 与 网 络 连 接 的 设备 ， 如 果 设 计 或 安 污 不 
当 ， 将 可 能 危及 安全 ， 在 这 种 情况 下 它 仅 提供 了 一 种 安全 的 假象 (这 比 根 本 没有 
Bij x Sin ERE! ) 。 


公共 因特网 





被 管理 网 络 


图 8-33 在 被 管理 网 络 和 外 部 之 加 放置 防火 场 
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Cisco 和 Check Point 是 当今 两 个 领先 的 防火 墙 厂商 。 你 也 能 够 容易 地 从 Linux 套件 使 
用 iptables ( 通 第 与 Linux 装 在 一 起 的 公共 域 软件 ) 产生 一 个 防火 墙 (分 组 过 滤器 ) 。 

防火 场 能 够 分 为 3 类 : 传统 分 组 过 滤器 (traditional packet filter) 、 状 态 过 滤器 (stateful 
filter) 和 应 用 程序 网 关 (application gateway) 。 在 下 面 小 节 中 ， 我 们 将 依次 学 习 它 们 。 

1 传统 的 分 组 过 滤 夫 

如 图 8-33 所 示 ， 一 个 机 构 通常 都 有 一 个 将 其 内 部 网 络 与 其 ISP (并 因此 与 更 大 的 公共 
因特网 相连 ) 相连 的 网 关 路 由 器 。 所 有 离开 和 进入 内 部 网 络 的 流量 都 要 经 过 这 个 路 由 器 ， 
而 这 个 路 由 带 正 是 分 组 过 滤 (packet filtering) 出 现 的 地 方 。 分 组 过 滤器 独立 地 检查 每 个 数 
据 报 ， 然 后 基于 管理 员 特 定 的 规则 决定 该 数据 报应 当 允 许 通 过 还 是 应 当 丢 弃 。 过 滤 决 定 通 
Hie + RIA: 

e IP 源 或 目的 地 址 。 

e 在 IP 数据 报 中 的 协议 类 型 字段 TCP, UDP, ICMP, OSPF 4%. 

e TCP ak UDP 的 源 和 目的 端口 。 

© TCP 标志 比特 : SYN, ACK 等 。 

。 ICMP 报 文 类 型 。 

e 数据 报 离开 和 进入 网 络 的 不 同 规则 。 

© 对 不 同 路 由 各 接口 的 不 同 规则 。 

网 络 管理 员 基 于 机 构 的 策略 配置 防火 墙 。 该 策略 可 以 考虑 用 户 生产 率 和 人 带宽 使 用 以 及 
对 一 个 机 构 的 安全 性 关注 。 表 8-5 列 出 了 一 个 机 构 可 能 具有 的 若干 可 能 的 策略 ， 以 及 它们 
是 如 何 用 一 个 分 组 过 滤 硕 来 处 理 分 组 的 。 例 如 ， 如 果 该 机 构 除 了 人 允许 访问 它 的 公共 Web 
服务 问 外 不 希望 任何 和 人 TCP 连接 的 话 ， 那 么 它 能 够 阻挡 所 有 的 和 人 TCP SYN 报 文 段 ， 但 有 具 
有 目的 地 交口 80 的 TCP SYN 报 文 段 除外 ， 并 且 该 目的 IP 地 址 对 应 于 该 Web 服务 器 。 如 
和 该 机 构 不 布 望 它 的 用 户 用 因特网 无 线 电 应 用 独占 访问 带宽， 那么 它 能 够 阻挡 所 有 非 关 键 
性 UDP 流量 〈 因 为 因特网 无 线 电 经 党 是 通过 UDP 发 送 的 ) 。 如 果 该 机 构 不 希望 它 的 内 部 
网 络 被 外 部 绘制 结构 图 〈 被 跟踪 路 由 ) ， 那 么 它 能 够 阻挡 所 有 ICMP TTL 过 期 的 报 文 离开 
该 机 构 的 网 络 。 
表 8-5 对 于 Web 服务 器 在 130. 207. 244. 203 的 某 机 构 网 络 130. 207/16， 其 策略 和 对 应 的 过 滤 规 则 


策略 防火 墙 设 置 
无 外 部 Web 访问 丢弃 了 所 有 到 任何 IP Hbk, aH 80 的 出 分 组 


无 人 TCP 连接 ,但 那些 只 访问 机 构 公 共 ERMA FJER 130. 207. 244. 203 、 端 口 80 外 的 任何 IP 地 址 的 人 TCP 
Web 服务 天 的 分 组 除外 SYN 分 组 


防止 Web 无 线 电 占 据 可 用 带宽 丢弃 所 有 人 UDP 分 组 ,但 DNS 分 组 除外 


丢弃 所 有 去 往 某 “广播 ”地 址 (例如 130.207.255.255) 的 ICMP 
ping 分 组 


防止 你 的 网 络 被 跟 蹊 路 由 丢弃 所 有 出 ICMP TTL 过 期 流量 





防止 你 的 网 络 被 用 于 一 个 smurf DoS 攻击 


一 条 过 滤 策 略 能 够 基于 地 址 和 端口 号 的 结合 。 例 如 ， 一 台 过 滤 路 由 器 能 够 转发 所 有 
Telnet 数据 报 (那些 具有 端口 号 23 的 数据 报 ) ， 但 那些 包括 在 一 个 特定 的 IP 地 址 列表 中 的 
去 往 和 来 自 的 地 址 除外 。 这 些 策略 允许 在 许可 列表 上 的 地 址 进行 Telnet 连接 。 不 幸 的 是 ， 
基于 外 部 地 址 的 策略 无 法 对 其 源 地址 被 哄骗 的 数据 报 提供 保护 。 


过 滤 也 可 根据 TCP ACK 比特 是 否 设置 来 进行 。 Was 户 连接 到 外 
部 服务 器 ， 却 要 防止 外 部 客户 连接 到 内 部 服务 需 ， 这 个 技巧 很 有 效 . 3.5 节 讲 过 ， 在 每 个 
TCP 连接 中 第 一 个 报 文 段 的 ACK 比特 都 设 为 0， eiie piesei Ai 的 ACK 比特 
都 设 为 1。 因此 ， 如 果 一 个 机 构 要 阻止 外 部 客户 发 起 到 内 部 服务 融 的 连接 ， 就 只 需 直 接 过 
滤 进 入 的 所 有 ACK 比特 设 为 0 的 报 文 段 。 这 个 策略 去 除了 所 有 从 外 部 发 起 的 所 有 TCP jE 
jk, 但 是 允许 内 部 发 起 TCP 连接 ， 

在 路 由 需 中 使 用 访问 控制 列表 实现 防火 场 规则 ， 每 个 路 由 需 接 口 有 它 肯 己 的 列表 . 
K 8-6 中 显示 了 对 于 某 机 构 222. 22/16 的 访问 控制 列表 的 例子 ， 该 访问 控制 列表 适用 于 将 
路 由 需 与 机 构 外 部 ISP 连接 的 革 个 接口 。 这 些 规则 被 应 用 到 通过 该 接口 目 上 而 下 传递 的 每 
个 数据 报 。 前 两 条 规则 一 起 允许 内 部 用 户 在 Web 上 冲浪 : 第 一 条 规则 允许 任何 具有 目的 
端口 80 的 TCP 分 组 离开 该 机 构 网 络 ; 第 二 条 规则 人 允许 任何 具有 源 端 口 80 H ACK 比特 置 
位 的 TCP 分 组 进入 该 机 构 网 络 . 注意 到 如 果 一 个 外 部 源 试 图 与 一 台 内 部 主机 建立 一 条 TCP 
连接 ， 该 连接 将 被 阻挡 ， 即 使 该 六 Kek A 的 端口 为 80。 接 下 来 的 两 条 规则 一 起 允许 DNS 分 
组 进入 和 离开 该 机 构 网 络 . 总 而 言 之 ， 这 种 限制 性 相当 强 的 访问 控制 列表 阻挡 所 有 流量 ， 
但 由 该 机 构 内 发 起 的 Web 流量 和 DNS 流量 除外 。[ CERT Filtering 2012 | 提供 了 一 个 推荐 
的 端口 ZX/ 协议 分 组 过 滤 的 列表 ， 以 避免 在 现 有 网 络 应 用 中 的 一 些 周 知 的 安全 性 漏洞 ， 


表 8-6 HT SE tenon Ln) 














动作 源 地 址 目的 地 址 协议 源 端 口 | 目的 端口 | 标志 比特 
允许 > 1023 80 任意 
允许 80 > 1023 ACK 
允许 UDP > 1023 53 | -- 
iF 222. 22/16 的 外 部 | 222. 22/16 LDP | 53 > 1023 一 


拒绝 | 全 部 全 部 | “全 部 
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CE (2 SE oP 2H et HE a PARE BE 1S Or 2B OP R ERER E. TARAS EEE ak KE Po HP En 
TCP 连接 ， 并 使 用 这 种 知识 作出 过 滤 决 定 . 

为 了 理解 状态 过 滤器 ， 我 们 来 重新 审视 表 8-6 中 的 访问 控制 列表 。 尽 管 限制 性 相当 
gh, K 8-6 中 的 访问 控制 列表 仍然 允许 来 自 外 部 的 ACK =1 且 源 端口 为 80 的 任何 分 组 到 
达 ， 通 过 该 过 滤 需 。 这 样 的 分 组 能 够 被 试图 用 异常 分 组 来 航 溃 内 部 系统 、 执 行 拒绝 服务 攻 
击 或 绘制 内 部 网 络 的 攻击 者 使 用 - 幼稚 的 解决 方案 是 也 阻挡 TCP ACK 分 组 ， 但 是 这 样 的 
方法 将 妨碍 机 构 内 部 的 用 户 在 Web 上 冲浪 。 

状态 过 滤 需 通过 用 一 张 连接 表 来 跟踪 所 有 进行 中 的 TCP 连接 来 解决 这 个 问题 。 这 种 方 
法 是 可 能 的 : 因为 防火 墙 能 够 通过 观察 三 次 握手 (SYN, SYNACK 和 ACK) 来 观察 一 条 新 
连接 的 开始 ; 而 且 当 它 看 到 该 连接 的 一 个 FIN 分 组 时 ， 它 能 够 观察 该 连接 的 结束 ， 当 防火 
增 经 过 比如 说 60 秒 还 没有 看 到 该 连接 的 任何 活动 性 ， 它 也 能 够 (保守 地 ) 假设 该 连接 结 
束 。 某 防火 墙 的 一 张 连接 表 例 子 显示 在 表 8-7 中 - 这 张 连接 表 指 示 了 了 当前 有 3 条 进行 中 
的 TCP 连接 ， 所 有 的 连接 都 是 从 该 机 构 内 部 发 起 的 。 此 外 ， 该 状态 过 滤 需 在 它 的 访问 控制 
列表 中 包括 了 一 个 新 栏 ， 即 “核对 连接 ”， 如 表 8-8 中 所 示 。 注 意 到 表 8-8 与 表 8-6 中 的 访 
问 控制 列表 相同 ， 只 是 此 时 它 指 示 应 当 核 对 其 中 两 条 规则 所 对 应 的 连接 : 
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# 8-7 用 于 状态 过 滤器 的 连接 表 
















37.96. 87. 123 
199. 1. 205. 23 
203. 77. 240. 43 
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表 8-8 用 于 状态 过 滤器 的 访问 控制 列表 


动作 目的 地 址 源 端口 ”| 目的 端口 | 标志 比特 | 核对 连接 
TCP - 意 









允许 | 222. 22716 > 1023 























允许 > 1023 X 
拒绝 


我 们 浏览 某 些 例子 来 看 看 连接 表 和 扩展 的 访问 控制 列表 是 如 何 联 手工 作 的 。 假 设 一 个 
攻击 者 通过 发 送 一 个 具有 TCP 源 端 口 80 和 ACK 标志 置 位 的 数据 报 ， 试 图 向 机 构 网 络 中 发 
送 一 个 异常 分 组 。 进 一 步 假设 该 分 组 具有 源 端口 号 12543 和 源 IP 地 址 150. 23. 23. 155。 当 
这 个 分 组 到 防火 墙 时 ， 防 火 墙 核 对 表 8-8 中 的 访问 控制 列表 ， 该 表 指 出 在 允许 该 分 组 进入 
机 构 网 络 之 前 还 必须 核对 连接 表 。 该 防火 墙 正确 地 核对 了 连接 表 ， 发 现 这 个 分 组 不 是 某 进 
行 中 的 TCP 连接 的 一 部 分 ， 从 而 拒绝 了 该 分 组 。 举 第 二 个 例子 ,假设 一 个 内 部 的 用 户 要 在 
外 部 Web 站 点 冲浪 。 因 为 该 用 户 首先 发 送 了 一 个 TCP SYN 报 文 段 ， 所 以 该 用 户 的 TCP jE 
接 在 连接 表 中 有 了 记录 。 当 Web 服务 器 发 送 回 分 组 (ACK 比特 进行 了 必要 的 设置 )， 该 防 
火 载 核 对 了 连接 表 并 明白 一 条 对 应 的 连接 在 进行 中 。 防 火 墙 因此 将 让 这 些 分 组 通过 ， 从 而 
不 会 干扰 内 部 用 户 的 Web 冲浪 活动 。 

3. 应 用 程序 网 关 

在 上 面 的 例子 中 ， 我 们 已 经 看 到 了 分 组 级 过 滤 使 得 一 个 机 构 可 以 根据 IP 的 内 容 和 
TCP/UDP 首部 (包括 下 地 址 、 端 口号 和 ACK 比特 ) 执行 粗 粒 度 过 滤 。 但 是 如 果 一 个 机 构 
仅 为 一 个 内 部 用 户 的 受 限 集合 〈 与 IP 地 址 情况 正 相 反 ) 提供 Telnet 服务 该 怎样 做 呢 ? 如 
采 该 机 构 要 这 些 特 权 用 户 在 允许 创建 向 外 部 的 Telnet 会 话 之 前 首先 鉴别 他 们 自己 该 怎样 做 
呢 ? 这 些 任务 部 超出 了 传统 过 滤 需 和 状态 过 滤 需 的 能 力 。 的 确 ， 有 关内 部 用 户 的 号 份 信息 
是 应 用 层 数 据 ， 并 不 包括 在 IP/TCP/UDP 首部 中 。 

为 了 得 到 更 高 水 平 的 安全 性 ， 防 火 墙 必须 把 分 组 过 滤 带 和 应 用 程序 网 关 结 合 起 来 。 应 
用 程序 网 关 还 除了 看 IPATCPAUDP 首部 外 ， 还 基于 应 用 数据 来 做 策略 决定 。 一 个 应 用 程序 
网 关 (application gateway) 是 一 个 应 用 程序 特定 的 服务 融 ， 所 有 应 用 程序 数据 (入 和 出 
的 ) 者 必须 通过 它 。 多 个 应 用 程序 网 关 可 以 在 同一 主机 上 运行 ， 但 是 每 一 个 网 关 都 是 有 和 目 
己 的 进程 的 单独 服务 需 。 

为 了 里 深入 地 了 解 应 用 程序 网 关 ， 我 们 来 设计 一 个 防火 墙 ， 它 只 允许 内 部 客户 的 受 限 
EG [Hb Telnet， 不 允许 任何 外 部 客户 问 内 Telnet。 这 一 策略 可 通过 将 分 组 过 滤 (在 一 台 
bt HH ae) 和 一 个 Telnet 应 用 程序 网 关 结 合 起 来 实现 ， 如 图 8-34 HR. H A EE ah 
配置 为 阻塞 所 有 Telnet 连接 ,但 从 该 应 用 程序 网 关 P 地 址 发 起 的 连接 除外 。 这 样 的 过 滤 
Amc BLE ETA le] Shay Telnet 连接 都 通过 应 用 程序 网 关 。 现 在 考虑 一 个 要 向 外 部 Telnet 的 
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内 部 用 户 。 这 个 用 户 必 须 首 先 和 应 用 程序 网 关 建 立 一 个 Telnet 会 话 。 在 网 天 (了 网关 监 听 进 
A Telnet 215 ) EE TI Pe Pr seas HP 输入 用 户 ID 和 口令 。 当 这 个 用 户 提 供 

这 些 信息 时 ， 应 用 程序 网 闫 检查 这 个 用 户 是 否 得 到 许可 疝 外 Tene, MRBM, AMN 
目 这 个 内 部 用 户 癌 该 网 关 发 起 的 Telnet 连接 。 如 果 该 用 户 得 到 许可 ， 则 这 个 网 关山 提示 
用 户 输入 它 所 要 连接 的 外 部 主机 的 主机 名 ; 加 在 这 个 网 关 和 某 外 部 主机 之 间 建 立 一 个 Tel 
net 会 话 ; 国 将 从 这 个 用 户 到 达 的 所 有 数据 中 继 到 该 外 部 主机 ， 并 且 把 来 自 这 个 外 部 主机 
的 所 有 数据 都 中 继 给 这 个 用 户 。 所以， 该 Telnet 应 用 程序 网 关 不 仅 执行 用 户 授 权 ， 而 且 同 
时 充当 一 个 Telnet 服务 融和 一 个 Telnet 客户 ， 在 这 个 用 户 和 该 远程 Telnet fe 4 #8 lal PA 
信息 。 注 意 到 过 滤器 因为 该 网 关 发 起 向 外 部 的 Telnet 连接 ， 将 允许 执 行 步 又 @) 


主机 到 网 关 的 网 关 的 到 远程 主机 
Telnet2 jG 的 Telnet 会 话 






图 8-34 ”由 应 用 程序 网 关 和 过 滤 旧 组 成 的 防火 墙 


匿名 与 隐私 

假定 你 要 访问 一 个 有 争议 的 Web 网 站 (例如 某 政 治 活动 家 的 网 站 ) ， 并 且 你 : ORAE 
向 该 Web 网 站 透漏 你 的 IP 地 址 ; 四 不 想 要 你 的 本 地 ISP ( 它 可 能 是 你 住家 或 办 公 室 的 
ISP) 知道 你 正在 访问 该 站 点 ; 四 ) 不 想 要 你 的 本 地 ISP 看 到 你 正在 与 该 站 点 交换 的 数据 
marake erea A EE 
即使 你 使 用 SSL， 你 也 无 法 实现 前 两 个 诉求 : 你 的 源 IP 地 址 呈现 在 你 发 送 给 Web 网 站 的 
每 个 数据 报 中 ; 你 发 送 的 每 个 分 组 的 目的 地 址 ot 易 地 被 你 本 地 ISP 嗅 探 到 - 

为 了 获得 隐私 和 匿名 ， 你 能 够 使 用 如 图 8-35 所 示 的 一 种 可 信 代 理 服务 器 和 SSL 的 
组 合 。 利用 这 种 方法 ， 你 首先 与 可 信 代 理 建 立 一 条 SSL 连接 .然后 你 在 该 SSL 连接 中 向 
所 希望 站 点 的 网 页 发 送 一 个 HTTP 请 求 ， 当 代理 接收 到 该 SSL 加 密 的 HTTP 请 求 ， 它 解 
Sin Kf) Web 站 点 转发 该 明文 HT TP 4 RK. 接 下 来 Web 站 点 响应 该 代理 ， 该 代理 经 
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it SSL 再 向 你 转发 该 响应 .因为 该 Web 站 点 仅 看 到 代理 的 IP 地址， 并 非 你 的 客户 IP 地 
址 ， 你 的 确 获得 了 对 该 Web 站 点 的 匿名 访问 。 并且 因 为 你 和 代理 之 间 的 所 有 流量 均 被 
加 密 ， 你 的 本 地 ISP 无 法 通过 对 你 访问 的 站 点 做 日 志和 记录 你 交换 的 数据 来 侵犯 你 的 隐 
私 今天 许多 公司 (例如 proxify. com) 提供 了 这 种 代理 服务 





匿名 代理 


图 8-35 利用 代理 提供 匿名 和 隐私 


当然 ， 在 这 个 解决 方案 中 ， 你 的 代理 知道 一 切 : 它 知道 你 的 IP 地 址 和 你 正在 冲浪 
的 站 点 的 IP 地 址 : 并 且 它 能 够 看 到 你 与 该 Web 站 点 之 间 以 明文 形式 交换 的 所 有 流量 -。 
办 此， 这 种 解决 方案 的 好 坏 取决 于 该 代理 的 可 信和 度 。 由 TOR 匿名 和 隐私 服务 所 采用 的 
一 种 更 为 健壮 的 方法 是 ， 让 你 的 流量 路 由 通过 一 系列 “不 串通 ”的 代理 服务 器 [TOR 
2012]. 特别 是 ，TOR 允许 独立 的 个 体 向 其 代理 池 贡 献 代理 。 当 某 用 户 使 用 TOR 与 一 个 
服务 器 连接 ，TOR 随机 地 (从 它 的 代理 池 ) 选择 一 条 三 个 代理 构成 的 链 ， 并 通过 该 链 
在 客户 和 服务 器 之 间 路 由 所 有 流量 。 以 这 种 方式 ， 假 设 这 些 代 理 并 不 串通 ， 无 人 知道 在 
你 的 IP 地 址 和 目标 Web 站 点 之 间 发 生 的 通信 。 此 外 ， 尽 管 在 最 后 的 代理 和 服务 器 之 间 
发 送 明 文 ， 但 这 个 最 后 代理 并 不 知道 哪个 IP 地 址 正在 发 送 和 接收 明文 


内 部 网 络 通常 有 多 个 应 用 程序 网 关 ， 例 如 Telnet, HTTP, FTP 和 电子 邮件 网 关 。 事实 
上 ， 一 个 机 构 的 邮件 服务 二 CUE 2.4 市 ) Al Web 高 速 绥 存 都 是 应 用 程序 网 关 。 

应 用 程序 网 关 也 有 其 缺陷 . 首先 ， 每 一 个 应 用 程序 都 需要 一 个 不 同 的 应 用 程序 网 关 。 
第 二 ， 因 为 所 有 数据 都 由 网 关 转 发 ， 付 出 的 性 能 负担 较 重 。 当 多 个 用 户 或 应 用 程序 使 用 同 
一 个 网 关 计 算 机 时 ， 这 成 为 特别 值得 关注 的 问题 。 最 后 ， 当 用 户 发 起 一 个 请 求 时 ， 客 户 软 
件 必须 知道 如 何 联系 这 个 网 关 ， 并 且 必 人 须 告 诉 应 用 程序 网 关 如 何 连 接 到 哪个 外 部 服务 句 。 
8.9.2 入 侵 检 测 系 统 

我 们 刚刚 看 到 ， 当 决定 让 哪个 分 组 通过 防火 墙 时， 分 组 过 滤 需 (传统 的 和 状态 的 ) 检 
fr IP, TCP, UDP Al ICMP 首部 字段 。 然 而 ， 为 了 检测 多 种 攻击 类 型 ， 我 们 需要 执行 深度 
分 组 检查 (deep packet inspection ) ， 即 查看 首部 字段 以 外 部 分 ,深入 查看 分 组 携 齐 的 实际 
MEHI RÍE < embers .9. 1 AL, I Bee) 2 io RE nH. Tn — Ae HESY 
网 关 仅 对 一 种 特定 的 应 用 程序 执行 这 种 检查 . 

显然 ， + 4 AOE 商机 ， 即 一 种 不 仅 能 够 uae ae ee 
iS (RAW Folate at). LETT RE oA ee (与 分 组 过 滤 需 不 同 ) 的 设备 。 
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样 的 设备 观察 到 一 个 可 疑 的 分 组 时 ， 或 一 系列 可 疑 的 分 组 时 ， 它 能 够 防止 这 些 分 组 进入 该 
J 2 者 仅仅 是 因为 觉得 该 活动 可 疑 ， 该 设备 里 说 能 人 够 让 这 些 分 组 遂 过 ， 但 要 向 网 
络 管 理 员 发 出 告警 ， 网 络 管理 员 然 后 密切 关注 该 流量 并 采取 适当 的 行动 ， 当 观察 到 潜在 恶意 
sat r wg fy MPA re PRA A ERM KZ (Intrusion Detection System, IDS), HEBR oJ REE 
量 的 设备 称 为 入 侵 防 止 系 统 (Intrusion Prevention System，IPS)， 在 本 节 中 我 们 一 起 学 习 IDS 

和 IPS 这 两 种 系统 ， 因为 这 些 系统 的 最 为 有 趣 的 技术 方面 是 它们 检测 可 疑 流量 的 原理 (而 不 
是 它们 是 否 发 送 告警 或 琉 弃 分 组 ) 。 我们 因此 将 IDS 系统 和 IPS 系统 统称 为 IDS 系统 

IDS 能 够 用 于 检测 多 种 攻击 ， 包 括 网 络 映 射 (例如 使 用 nmap 进行 分 析 )、 端 口 扫描 、 
TCP age DoS 市 损 洪 泛 攻击 aa Aes. PEPE RSC AE A ee Mes PE E 
(参见 1.6 市 有 关 网 络 攻 击 的 概述 内 容 。) 目前 ， 数 以 千 计 的 机 构 应 用 了 IDS 系统 .这 些 已 部 
a 许多 是 专用 的 ，Cisco 、Check Point 和 其 他 安全 装备 厂商 在 市 场 上 销售 这 些 系 统 。 但 
是 许多 已 部 痢 的 IDS 系统 是 公共 域 系 统 ， 如 极为 流行 的 Snort IDS 系统 〈 我 们 将 简要 讨论 它 ) - 

一 个 机 构 可 能 在 它 的 机 构 网 络 中 部 署 一 个 eT IDS fe ea. (AL 8-36 显示 了 一 个 县 
有 3 个 1IDS (EARLE. “SB Ae eR EIN, EW a PETA TAE, te] io IDS 
Mb SH AIK A A BE at Be SA a, Ach RP Sa CE “ACA Gey [a] 
网 络 管理 员 发 送 告警。 在 图 8-36 中 ， 该 机 构 将 其 网 络 划分 为 两 个 区 域 : 一 个 高 度 安 全 区 
域 ， 由 分 组 过 滤 硕 和 应 用 程序 网 关 保 护 ， 并 且 由 IDS 系统 监视 ;一 个 较 低 度 安全 区 域 ( 称 
之 为 非 军 事 区 (DeMilitarized Zone, Wath AX bh H 分 组 过 TUE Art, Hih IDS 系 
统 监 视 。 注 意 到 DMZ et i 了 该 机 构 需 要 与 外 部 通信 的 服务 器， 如 它 的 公共 Web 服务 器 和 
它 的 权威 DNS 服务 


因特网 





i Web FTP DNS 
a | 服务 器 。 服务 器 RAA 
anes FEFK 


kK] 8-36 部署 一 个 过 滤 右 、 一 个 应 用 程序 网 关 和 多 个 IDS {ER AST AL 


此 时 你 也 许 想 知道 ， 为 什么 使 用 多 个 IDS 传 感 占 ?为 什么 在 图 8-36 中 不 只 是 在 分 组 
过 滤 衣 后面 放置 一 个 IDS 传 感 六 (或 者 甚至 与 分 组 过 滤 关 综合)? 我们 将 很 快 看 到 ，IDS 不 
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仪 需 要 做 深度 分 组 检查 ， 而 且 必 须要 将 每 个 过 往 的 分 组 与 数 以 万 计 的 “特征 (signature )” 
进行 比较 ; 这 可 能 导致 极 大 的 处 理 量 ， 特 别 是 如 果 机 构 从 因特网 接收 每 秒 数 十 亿 比 特 的 流 
量 时 更 是 如 此 。 将 IDS 传 感 希 进一步 问 下 许 放 置 ， 每 个 传 感 大 仅 看 到 该 机 构 流 量 的 一 部 
分 ， 维 护 能 够 更 容易 。 无 论 如 何 ， 目 前 有 许多 高 性 能 IDS A IPS 系统 可 供 使 用 ， 许 多 机 构 
实际 上 能 够 在 靠近 其 接 人 路 由 需 附 近 只 使 用 一 个 传 感 大 

IDS 系统 大 致 可 分 类 为 基于 特征 的 系统 (signature-based system) 或 基于 异常 的 系统 
(anomaly- based system) 。 基 于 特征 的 IDS 维护 了 一 个 范围 广泛 的 攻击 特征 数据 库 ， 每 个 特 
征 是 与 一 个 人 侵 活 动 相关 联 的 规则 集 。 一 个 特征 可 能 只 是 有 头 单 个 分 组 的 特性 列表 (例如 
源 和 目的 端口 号 、 协 议 类 型 和 在 分 组 载 全 中 的 特定 比特 串 )， 或 者 可 能 与 一 系列 分 组 有 关 、 
这 些 特征 通常 由 人 研究 了 已 知 攻击 、 技 万 熟练 的 网 络 安全 工程 是 生成 。 一 个 机 构 的 网 络 管 理 
员 能 够 定制 这 些 特征 或 者 将 其 加 进 数 据 库 中 。 

从 运行 上 讲 ， 基 于 特征 的 IDS 嗅 探 每 个 通过 它 的 分 组 ， 将 每 个 嘿 探 的 分 组 与 数据 库 中 
的 特征 进行 比较 。 如 果 某 分 组 (或 分 组 序列 ) 与 数据 库 中 的 一 个 特征 相 匹 配 ，IDS 产生 一 
个 告警 .该 告警 能 够 发 送 一 个 电子 邮件 报 文 给 网 络 管理 员 ， 能够 发 送 给 网 络 管理 系统 ， 或 
只 是 做 日 志 以 供 以 后 检查 。 

尽管 基于 特征 的 IDS 系统 部 署 广泛 ， 但 仍 具 有 一 些 限 制 ， 更 重要 的 是 ， 它 们 要 求 根据 
以 前 的 攻击 知识 来 产生 一 个 准确 的 特征 。 换 言 之 ， 基 于 特征 的 IDS 对 不 得 不 记录 的 新 攻击 
完全 缺乏 判断 力 。 男 一 个 缺点 是 ， 即 使 与 一 个 特征 匹配 ， 它 也 可 能 不 是 一 个 攻击 的 结果 ， 
因此 产生 了 一 个 虚假 告警 。 最后， 因为 每 个 分 组 必须 与 范围 广泛 的 特征 集合 相 比 较 ，IDS 
可 能 处 于 处 理 过 载 状 态 并 因此 难以 检测 出 许多 恶意 分 组 

当 基 于 异常 的 IDS 观察 正常 运行 的 流量 时 ， 它 会 生成 一 个 流量 概况 文件 。 然 后 ， 它 寻 
fee LA PNA i, Pa, ICMP 分 组 不 寻 管 的 百分比 ， 或 端口 扫描 和 ping 掠 过 时 
致 指数 性 突然 增长 。 基 于 异 第 的 IDS 系统 最 大 的 特点 是 它们 不 依赖 现 有 攻击 的 以 前 知识 
在 另 一 方面 ， 区 分 正常 流量 和 统计 异 篆 流量 是 一 个 极 具 挑战 性 的 问题 .迄今 为 止 ， 大 多 数 
部 署 的 IDS 主要 是 基于 特征 的 ， 尽 管 某 些 IDS 包括 了 某 些 基于 异常 的 特性 。 

Snort 

Snort 是 一 种 公共 域 开 放 源 码 的 IDS， 现 有 部 署 达 几 十 万 [Snort 2012; Koziol 2003 | - 
它 能 够 运行 在 Linux, UNIX 和 Windows 平台 上 。. 它 使 用 了 通用 的 哩 探 接口 libpcap，Wire- 
shark 和 许多 其 他 分 组 嗅 探 豆 也 使 用 了 libpcap。 它 能 够 轻松 地 处 理 100Mbps 的 流量 ; X 
在 干 兆 比特 / 秒 流量 速率 下 工作 ， 需要 多 个 Snort (ERAR - 

为 了 对 Snort 有 一 些 认识 ， 我 们 来 看 一 个 Snor 特征 的 例子 : 


alert icmp $EXTERNAL_NET any -> $HOME_NET any 
(msg:”ICMP PING NMAP”; dsize: 0; itype: 8;) 


这 个 特征 由 从 外 部 ($EXTERNAL_NET) 进入 机 构 网 络 ( $HOME_NET) 的 任何 ICMP 
分 组 所 匹配 ， 其 类 型 是 8 (ICMP ping) 并 且 具 有 空 负载 ( dsize =0)。 因 为 nmap (参见 1.6 
H) 用 这 些 特定 的 特征 产生 这 些 ping 分 组 ， 所 以 设计 出 该 特征 来 检测 nmap 的 ping 扫描 。 当 
某 分 组 匹配 该 特征 时 ，Snor 产生 一 个 包括 “1CMP PING NAMP” 报 文 的 告警 ， 

也 许 关 于 Snort 印象 最 为 深刻 的 是 巨大 的 用 户 社区 和 维护 其 特征 数据 库 的 安全 专家 。 通 
常 在 一 个 新 攻击 出 现 后 的 几 个 小 时 内 ，Snort 社区 就 编写 并 发 布 一 个 攻击 特征 ， 然 后 它 就 能 被 
分 布 在 全 世界 的 数 十 万 Snort WAA PR. ISh, (EH Snort 特征 的 语法 ， 网 络 管理 员 能 够 根 
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在 本 音 中 ， 我 们 考察 了 秘密 情人 Bob 和 Alice 能 够 用 于 安全 通信 的 各 种 机 制 。 我 们 看 
到 Bob 和 Alice 对 下 列 因 素 感 兴趣 :机密 性 (因此 只 有 他 们 才能 理解 传输 的 报 文 内 容 )、 端 
点 鉴别 (因此 他 们 确信 正在 与 对 方 交 谈 ) 和 报 文 完整 性 (因此 他 们 确信 在 传输 过 程 中 他 
们 的 报 文 示 被 算 改 )。 当 然 ， 安 全 通信 的 需求 并 不 限于 秘密 情人 的确， 我 们 在 8.5 ~8.8 
节 中 看 到 ， 可 以 在 网 络 体系 结构 中 的 各 个 层次 使 用 安全 性 ， 使 之 免 受 采 用 各 种 各 样 攻 击 手 
段 的 “ 坏 家 伙 ” 的 侵扰 。 

本 章 前 面部 分 给 出 了 安全 通信 所 依赖 的 各 种 原理 。 在 8.2 WP, RITEK T E AE 
窜 数 据 的 密码 技术 ， 包 括 对 称 密 钥 密 码 和 公开 密 钥 密码 。 作 为 今天 网 络 中 两 种 重要 的 密 公 
技术 的 特定 的 学 习 案 例 ， 我 们 考察 了 DES 和 RSA. 

在 8.3 节 中 ， 我 们 研究 了 提供 报 文 完整 性 的 两 种 方法 : 报 文 鉴别 码 (MAC) 和 数字 签 
Ho 这 两 种 方法 有 一 些 共 同 之 处 。 它 们 都 使 用 了 密码 散 列 函数 ， 这 两 种 技术 都 使 我 们 能 够 
验证 报 文 的 源 以 及 报 文 自身 的 完整 性 。 一 个 重要 的 差异 是 MAC 不 依赖 于 加 密 ， 而 数字 签 
名 要 求 公 钥 基础 设施 。 如 我 们 在 8.5 ~8.8 节 所 见 ， 这 两 种 技术 广泛 在 实际 中 都 得 到 了 广 
泛 应 用 。 此外， 数字 签名 用 于 生成 数字 证 书 ， 数 字 证 书 对 于 证 实 公 钥 的 合法 性 是 重要 的 .， 
在 8.4 节 中 ， 我 们 考察 了 端点 鉴别 并 引入 了 不 重 数 以 防御 重 放 攻 击 . 

在 8.5 ~8.8 节 中 ， 我 们 研究 了 几 种 在 实践 中 得 到 广泛 使 用 的 安全 性 网 络 协 议 。 我 们 
看 到 了 对 称 密 钥 密码 在 PGP, SSL, [Psec 和 无 线 安 全 性 中 的 核心 地 位 。 我 们 看 到 了 公开 密 
钥 密 人 码 对 PGP 和 SSL 是 至 关 重 要 的 。 我 们 看 到 PGP 使 用 数字 签名 而 SSL 和 IPsec 使 用 MAC 
来 保证 报 文 完整 性 。 在 目前 理解 了 密码 学 的 基本 原理 以 及 学 习 了 这 些 原理 的 实际 应 用 方法 
之 后 ， 你 现在 已 经 有 能 力 设 计 你 自己 的 安全 网 络 协议 了 |! 

利用 8.2 ~8.4 节 所 包含 的 技术 ，Bob 和 Alice 就 能 够 安全 通信 了 。 (只 布 望 他 们 是 学 
习 了 这 些 材料 的 网 络 专业 学 生 ， 因 此 能 够 使 他 们 的 约会 不 会 被 Trudy 发 现 !) 而 机 密 性 仅 
是 整个 网 络 安全 的 一 小 部 分 。 如 我 们 在 8. 9 节 中 所 学习 ， 现 在 网 络 安全 的 焦点 越 来 越 多 地 
关注 网 络 基础 设施 的 安全 性 ， 以 防止 “ 坏 家 伙 ” 的 潜在 猛烈 攻击 。 在 本 草 的 后 面部 分 ,我 
们 因此 学 习 了 防火 墙 和 IDS 系统 ， 它 们 检查 进入 和 离开 一 个 机 构 网 络 的 分 组 

本 章 已 经 涉及 了 许多 基础 性 问题 ， 同 时 关注 了 现代 网 络 安全 性 中 最 为 重要 的 主题 。 布 
望 深 入 钻研 的 读者 最 好 研究 本 章 中 引用 的 文献 。 特 别 是 ， 我 们 推荐 以 下 读物 : 关于 攻击 和 
运行 安全 性 的 | Skoudis 2006 ] ， 关 于 密码 学 及 其 如 何 应 用 于 网 络 安全 的 | Kaufman 1995 | , 
关于 SSL 处 理 的 有 深度 且 可 读 性 强 的 【 Rescorla 2001 | ， 以 及 透彻 地 讨论 802. 11 安全 性 的 
| Edney 2003 | (其 中 包括 对 WEP 及 其 缺陷 的 深入 人 研究)。 


读 后 习题 和 问题 





8.1% 
RI. 报 文 机 密 性 和 报 文 完 整 性 之 间 的 区 别 是 什么 ”你 能 具有 机 蜜 性 而 没有 完整 性 吗 y” 你 能 具有 完整 性 而 
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没有 机 密 性 吗 ? 证 实 你 的 答案 
R2. 因特网 实体 (路 由 器 、 交 换 机 、DNS ARH AE. Web RGA. HP ARS) 经 滑 需 要 安全 通信 。 给 
出 三 个 特定 的 因特网 实体 对 的 例子 ,它们 要 安全 通信 . 
8.2 节 
R3. 从 服务 的 和 角度， 对 称 密 钥 系统 和 公开 密 钥 系统 之 间 一 个 重要 的 差异 是 什么 ? 
R4. 假定 某 和 侵 者 拥有 一 个 加 密 报 文 以 及 该 报 文 的 解密 版 本 .这 个 人 侵 者 能 够 发 起 已 知 密 文 攻击 、 已 知 
明文 攻击 和 选择 明文 攻击 吗 ? 
RS. 考虑 一 个 8 块 密码 。 这 个 密码 有 多 少 种 可 能 的 输入 块 ” 有 多 少 种 可 能 的 映射 ”如果 我 们 将 每 种 映射 
视 为 一 个 密 钥 ， 则 该 密码 具有 多 少 种 可 能 的 密 钥 ”? 
R6. 假定 N 个 人 中 的 每 个 人 都 和 其 他 NA-1 个 人 使 用 对 称 密 钥 密 码 通信 -: ENA Ci 和) 之 间 的 所 有 通 
信 对 该 N 个 人 的 组 中 的 所 有 其 他 人 都 是 可 见 的 ， 且 该 组 中 的 其 他 人 都 不 应 当 能 够 解密 他 们 的 通信 . 
则 这 个 系统 总 共 吉 要 多 少 个 密 钥 ?现在 假定 使 用 公开 帘 钥 密码 。 此 时 需要 多 少 个 窗 钥 ? 
R7. 假定 n=10000、a=10023 Alb =10004. 请 你 使 用 等 同 的 模 算 术 来 心算 (ab) mod nn， 
R8. 假设 你 要 通过 加 密 对 应 于 报 文 1010111 的 十 进 制 数 来 加 密 该 报 文 。 该 十 进 制 数 是 什么 ? 
8.3~8.4 节 
R9. 散 列 以 何 种 方式 提供 比 检验 和 (如 央 特 网 检验 和 ) 更 好 的 报 文 完 整 性 检验 ”? 
RIO. 你 能 够 “解密 ” 某 报 文 的 散 列 来 得 到 初始 报 文中 ”解释 你 的 答案 
R11. 考虑 MAC 算法 (图 8-9) 的 一 种 变形 算法 ， 其 中 发 送 方 发 送 (m,，H(m) +s), 这 里 H(m) +s 是 
H(m) 和 s 的 级 联 。 该 变形 算法 有 缺陷 蚂 ? 为 什么 ? 
R12. 一 个 签名 的 文档 是 可 鉴别 的 和 不 可 伪造 的 ， 其 含义 是 什么 ? 
R13. 公 钥 加 密 的 报 文 散 列 以 何 种 方式 比 使 用 公 钥 加 密 报 文 提 供 更 好 的 数字 签名 ? 
R14. 假设 certifier. com 生成 一 个 用 于 foo. com 的 证 书 。 通常 整个 证 书 将 用 certifier. com 的 公 负 加密， 这 种 
说 法 是 正确 还 是 错误 ? 
RIS. 假设 Alice 有 一 个 准备 发 送 给 任何 请 求 者 的 报 文 。 数 以 千 计 的 人 要 获得 Alice 的 报 文 ， 但 每 个 人 都 要 
确保 该 报 文 的 完整 性 。 在 这 种 场景 下 ， 你 认为 是 基于 MAC 还 是 基于 数字 签名 的 完整 性 方案 更 为 迁 
a? 为 什么 ? 
R16. 在 某 端 点 鉴别 协议 中 ， 使 用 不 重 数 的 目的 是 什么 ”? 
R17. 我 们 说 一 个 不 重 数 是 一 个 在 生存 期 中 只 使 用 一 次 的 值 ， 这 意味 着 什么 ”其 中 是 指 谁 的 生存 期 ? 
R18. 基于 HMAC 的 报 文 完整 性 方案 易 受 重 放 攻 击 影响 吗 y” 如 果 是 ， 能 够 在 方案 中 综合 一 个 不 生 数 来 去 除 
这 种 脆弱 性 吗 ? 
8.5~8.8 节 
R19. 假定 Bob 从 Alice 处 接收 一 个 PGP 报 文 。Bob 怎样 才能 确定 Alice ( 而 不 是 如 Trudy) 生成 了 该 报 文 ? 
PGP 为 保证 报 文 完整 性 使 用 了 MAC mg? 
R20. 在 SSL 记录 中 ， 有 一 个 字段 用 于 SSL 序号。 这 种 说 法 是 正确 还 是 错误 ? 
R21. 在 SSL 握手 中 随机 不 重 数 的 目的 是 什么 ? 
R22. 假设 某 SSL 会 话 应 用 了 具有 CBC 的 块 密码 ， 服务器 以 明文 回 客 户 发送 了 IV. 这 种 说 法 是 正确 还 是 
错误 ? 
R23. 假设 Bob 向 Trudy 发 起 一 条 TCP 连接， 而 Trudy 正在 伪装 她 是 Alice. {Ei FHH]. Trudy je] Bob 发 
送 Alice 的 证 书 。 在 SSL 握手 算法 的 哪 一 步 ，Bob 将 发 现 他 没有 与 Alice 通信 ? 
R24. 考虑 使 用 IPsec 从 主机 A 向 主机 B 发 送 分 组 流 。 通 常 ， 为 该 流 中 的 每 个 发 送 分 组 将 创建 一 个 新 SA 
这 种 说 法 是 正确 还 是 错误 ? 
R25. 假设 在 图 8-28 中 总 部 和 分 支 机 构 之 间 通 过 IPsec 运行 TCP。 如 果 TCP 重新 传输 相同 的 分 组 ， 则 由 
RI 发 送 的 两 个 对 应 的 分 组 将 在 ESP 首部 中 具有 相同 的 序号 。 这 种 说 法 是 正确 还 是 铺 识 ? 
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R26. IKE SA 和 IPsec SA 是 相同 的 东西 。 这 种 说 法 是 正确 还 是 错误 ? 

R27. 考虑 802. 11 fy WEP. 假定 数据 是 10101100 并 且 密 钥 流 是 11110000 ， 相 应 的 密 文 是 什么 ? 

R28. 在 WEP 中 ， 在 每 个 帧 中 以 明文 发 送 IV、 这 种 说 法 是 正确 还 是 错误 ? 

8.9 节 

R29. 状态 分 组 过 滤 壳 维护 两 个 数据 结构 . 给 出 它们 的 名 字 并 简单 地 讨论 它们 做 些 什么 

R30. SIRs eseny (CARAS) 分 组 过 滤 句 。 该 分 组 过 滤 铝 可 能 基于 TCP 标志 位 以 及 其 他 首部 字段 过 
滤 分 组 ,这 种 说 法 是 正确 还 是 错误 ? 

R31. 在 传统 的 分 组 过 滤 需 中 ， 每 个 接口 能 够 具有 上 月 己 的 访问 控制 表 ， 这 种 说 法 是 正确 还是 错误 ? 

R32. 为 什么 应 用 程序 网 关 必 须 与 分 组 过 滤 磺 协同 工作 才能 有 效 ” 

R33. 基于 特征 的 IDS 和 1PS 检查 TCP 和 UDP 报 文 段 的 载荷 . 这 种 说 法 是 正确 还 是 错误 ? 


Zon 


使 用 图 8-3 PRIIS (te aay, JMR SC “This is an easy problem”， 并 解密 报 文 “rmij'u uamu xyj”. 
P2. Trudy (HJH F G WI sci. Spa Ae 7 个 字母 的 ( 密 文 ,明文 ) 转换 对 ， 减少 了 8.2.1 市 的 例 
中 将 被 检查 的 大 约 10 数量 级 的 可 能 替换 的 数量 .请 说 明之 ， 
P3. ZER 8-4 Wasa Seta AS. 利用 报 文 “ The quick brown fox jumps over the lazy dogs ”得 到 
的 明文 编码 ， 选 择 明 文 攻击 足以 破解 所 有 报 文 吗 ? 为 什么 
P4. 考虑 图 8-5 中 显示 a ie te SR T, 只 是 反 转 了 8 个 输入 比特 的 次 序 〈 例 如 ， 使 得 
11110000 Z žy 00001111). 进一步 假设 64 比特 置 乱 吨 数 不 修 改 任何 比特 《使 得 第 普 个 比特 的 输出 值 
王 于 第 到 个 比特 的 输入 值 ) 。 
a 对 于 n=3 和 初始 64 比特 输入 等 于 10100000 重复 了 8 次 ， 输 出 的 值 是 多 少 ? 
b 重复 (a) ， 但 此 时 将 初始 64 比特 的 最 后 一 个 比特 从 0 变 为 ] 
co 重复 (a) 和 (b)， 但 此 时 假定 64 比特 的 置 乱 果 数 反 转 了 64 比特 的 次 序 ， 
PS. 考虑 图 8-5 由 的 块 密码 对 于 给 定 的 “ 密 钥 ”，Alice 和 Bob 将 需要 8 个 表 ， 每 张 表 8 比特 乘 以 8 比 
FF- XIF Alice (或 Bob) 来 说 ， 要 存储 所 有 8 张 表 ， 将 需要 多 少 比 特 的 存储 需 ? 这 个 数 如 何 与 一 个 
全 表 64 比特 的 块 密码 所 需 的 比特 数 进行 比较 ? 
Po. ZIEK 8-1 中 的 3 比特 块 密 人 码 。 假定 明 文 是 100100100, 
a. 初始 假设 未 使 用 CBC， 生 成 的 密 文 是 什么 ? 
b. 假设 Trudy 嗅 探 该 窗 文 。 假 设 她 知道 正在 应 用 无 CBC 的 一 个 3 比特 块 密码 (但 不 知道 特定 的 密 
码 )， 她 能 够 推测 到 什么 ? 
co 现在 假设 使 用 CBC， 其 中 1V =111。 产生 的 密 文 是 什么 ? 
P7. 如 题 
a. 使 用 RSA, BEF Rp =3 和 9=11， 采用 对 每 个 字母 独立 地 加 密 的 方法 加 密 短 奢 “dog”。 对 已 加 密 报 
文 应 用 解密 算法 恢复 出 原 报 文 . 
b 重复 (a) ， 而 此 时 加 密 “dog” 作 为 一 个 报 文 m. 
P8. Fie AA p=5 和 gqg=11 的 RSA, 
a. n All: 是 什么 ? 
b 令 e 为 3 为 什么 这 是 一 个 对 e 的 可 接受 的 选择 ? 
c. sh d 使 得 de=1 h mod z) Ail d < 160. 
d. 使 用 密 钥 (n, e) MERL m=8. Oc 表示 对 应 的 密 文 ， 显 示 所 有 工作 . 提示 : 为 了 简化 计算 ， 
使 用 如 下 事实 
| (a mod n) » (b mod n) |moda = (a.b)modn 


PO. 在 这 个 习题 中 .我 们 探讨 Diffie- Hellman( DH) 公 和 钥 加 密 算法 ， 该 算法 允许 两 个 实体 协商 一 个 共享 的 
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密 钥 ， 该 DH 算法 利用 一 个 大 素数 p 和 男 一 个 小 于 p 的 大 数 g. p 和 g 都 是 公开 的 (因此 攻击 者 将 知 

WEN). 在 DH P, Alice 和 Bob 每 人 分 别 独立 地 选择 秘密 密 钥 S$, ALS, Alice 则 通过 将 g 提高 到 5S 

并 以 p 为 模 来 计 算 她 的 公 钥 7,。 类 似 地 ，Bob 则 通过 将 g 提高 到 S, 并 以 p 为 模 来 计算 他 的 公 和 角 Ta 

此 后 Alice 和 Bob 经 过 因特网 交换 他 们 的 公 钥 Alice 则 通过 将 T, 提高 到 5, 并 以 p 为 异 来 计 算出 共享 

we S, FED, Bob 则 通过 将 T, BERS BIS, 并 以 p 为 模 来 计算 出 共享 党 钥 S. 

a 证明 在 一 般 情况 下 .Alice 和 Bob 得 到 相同 的 对 称 密 钥 ， 即 证 明 S = 8’, 

bh. 对 于 p=11 Mg=2, 假定 Alice 和 Bob 分 别 选择 私 钥 $, =5 ALS, =12, “it Alice 和 Bob 的 公 钥 T, 
HT 显示 所 有 计算 过 程 . 

c. 接着 (b) .现在 计算 共享 对 称 窗 钥 S$， 显示 所 有 计算 过 程 。 

d. 提供 一 个 时 序 图 ， 显 示 Diffie-Hellman 是 如 何 能 够 受到 中 间 人 攻击 的 ， 该 时 序 图 应 当 具 有 3 条 垂直 
线 、 分 别 对 应 Alice 、Bob 和 攻击 者 Trudy, 


PIO. 假定 Alice 要 与 采用 对 称 密 钥 密码 体制 的 Bob 使 用 一 个 会 话 密 钥 人 K, 通信 。 在 8.2 74, 我们 知道 了 


Pil 


Plz. 


PLS. 


P14. 


PIS. 


P16. 


如 何 使 用 公开 密 钥 密码 从 Alice 向 Bob 分 发 该 会 话 密 钥 ， 在 本 习题 中 ， 我 们 探讨 不 使 用 公开 密 钥 密 

码 而 使 用 一 个 密 钥 分 发 中 心 (KDC) 分 发 会 话 密 钥 的 方法 .KRDC 是 一 个 与 每 个 注册 用 户 共 享 独特 的 

秘密 对 称 密 钥 的 服务 器 。 对 于 Alice 和 Bob WMA, Kirn 和 Kyrie 表示 了 这 些 密 钥 。 设计 一 个 使 用 

KDC 向 Alice 和 Bob 分 发 人 、 的 方案 。 你 的 方案 应 当 使 用 三 种 报 文 来 分 发 会 话 密 钥 : 一 种 从 Alice 到 

KDC 的 报 文 ; 一 种 从 KDC 到 Alice 的 报 ms yao 是 从 Alice 到 Bob 的 报 文 。 第 一 种 报 文 为 

Kxpe(4，B)。 使 用 标记 Koc、 Keros S AM BAA PS, 

a. 第 二 种 报 文 是 什么 ? 

b. 第 三 种 报 文 是 什么 ? 

计算 一 个 不 同 于 图 8-8 中 的 两 个 报 文 的 第 三 个 报 文 ， 使 该 报 文具 有 与 图 8-8 中 eae 相同 的 检验 和 

假定 Alice 和 Bob 共享 两 个 秘密 密 钥 : 一 个 鉴别 密 钥 S 和 一 个 对 称 加 密 密 钥 $,。 扩 充 图 8-9， 使 之 

提供 完整 性 和 机 密 性 . 

在 BitTorrent P2P 文件 分 发 协 以 中 (人 参见 第 2 章 ) ， 种 子 将 文件 分 割 为 块 ， 并 且 对 等 方 彼此 重 分 发 这 

些 块 。 不 使 用 任何 保护 ， 一 个 攻击 者 能 够 容 PERTTI: 善意 的 对 等 方 并 向 洪流 中 的 一 部 分 对 等 方 

发 送 假冒 块 来 实施 破坏 。 这些 未 被 怀 和 发 送 这 些 假冒 块 ， 其 他 对 等 方 

则 将 再 次 向 甚至 更 多 的 对 等 方 于 新 分 发 这 些 假冒 块 。 因 此 ， bai BitTorrent Kik, ACH] — PPL A fe 

对 等 方 能 验证 一 个 块 的 完整 性 ， 从 而 使 得 假冒 块 Ji 分 发 ， 这 是 至 关 重 要 的 。 假 设 当 某 对 等 方 加 入 

一 个 洪流 时 ， 它 初始 从 一 个 完全 受信 任 的 源 得 到 一 个 . torrent mere 描述 允许 对 等 方 验证 块 完整 性 

的 一 个 简单 的 方案 

OSPF 路 由 选择 办 议 使 月 m 个 MAC 而 不 是 数字 签名 来 提供 报 文 完整 性 。 你 认为 选择 MAC 而 未 选择 
字 签 名 的 原因 是 什么 

考 8-18 ri YE 其 中 Alice [nj] Bob 鉴别 她 自己 ,我 们 看 来 工作 正常 ( 即 我 们 没有 发 现 其 

中 有 缺陷 )。 现 在 假定 当 Alice 向 Bob 鉴别 她 自己 的 同时 ，Bob 必须 向 Alice 鉴别 他 自己 。 给 出 一 个 

情况 ， 此 时 Trudy 假装 是 Alice, [6] Bob 鉴别 她 自己 是 Alice。( 提 示 : 该 协议 运行 的 顺序 ， 鉴 别 过 程 

可 由 Trudy 或 Bob 发 起 ， 能 够 任意 地 交织 在 一 起 。 特 别 注意 Bob 和 Alice 将 使 用 不 重 数 这 样 一 个 事 

， 如 果 不 小 心 的 话 ， 能 够 恶意 地 使 用 相同 的 不 重 数 ,) 

一 个 目 然 的 问题 是 我 们 能 否 使 用 一 个 不 重 数 的 公 钥 密 但 来 解决 8.4 节 中 的 端点 鉴别 问题 。 考 虑 下 列 

自然 的 协议 : Alice fr] Bob 发 送 报 文 “Lam Alice”; @Bob 选择 一 个 不 重 数 并 将 其 发 送 给 Alice; 

G)Alice 使 用 她 的 私 钥 来 加 密 该 不 重 数 并 向 Bob 发 送 得 到 的 值 : Bob 对 接收 到 的 报 文 应 用 Alice 的 

公 钥 。 因 此，Bob 计算 尺 并 鉴别 了 Alice, 

a， 画 [图 表示 这 个 协议 ， 使 用 本 书 中 应 用 的 公 铀 和 私 钥 的 标记 法 。 

b. 假定 未 使 用 证 书 。 描述 Trudy 怎样 能 够 通过 拦截 Alice 的 报 文 ， 进 而 对 Bob 假装 她 是 Alice 而 成 为 
一 名 “中 间 人 ” 
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FIF: 


P18. 


P19, 


图 8-19 显示 了 Alice 必须 执行 PGP 的 操作 ， 以 提供 机 窜 性 、 鉴 别 和 完整 性 ， 图 示 出 当 Bob 接收 来 月 

Alice 的 包 时 必须 执行 的 对 应 操作 

假定 Alice 要 向 Bob 发 送 电 子 邮件 。Bob 具有 一 个 公共 -MAWI (Ke. Ke). 并 且 Alice 县 有 

Bob 的 证 书 ， 但 Alice 不 具有 公 钥 私 钥 对 -Alice 和 Bob (以 及 全 世界 ) FESS AT] Ago eK BH +) 

a. 在 这 种 情况 上 下， 能 设计 一 种 方案 使 得 Bob 能 够 验证 Alice MAEM CMS? MRE. JH IAEI i as 
Alice 和 Bob 是 如 何 做 的 ， 

b. 能 设计 一 个 对 从 Alice 向 Bob 发 送 的 报 文 提供 机 密 性 的 方案 吗 ” 如果 能 ， 用 方块 图 显示 Alice 和 和 
Bob 是 如 何 做 的 ， 

Bie FEI FH: SSL 会 话 的 一 部 分 的 Wireshark 输出 

a. Wireshark 分 组 112 是 由 客户 还 是 由 服务 香 发 送 的 ” 

b. IRI ARAJ IP 地 址 和 端口 号 是 什么 ”? 

e BERA EUA EIE, ao 的 序号 将 是 什么 ? 

d. Wireshark 分 给 112 nal 仿 了 多 少 个 SSL 记录 ? 

e 分 组 112 包含 了 一 个 主 密 铀 或 者 一 个 加 密 的 主 密 铀 吗 ” 或 者 两 者 都 不 是 ? 

f 假定 握手 类 seein 字 节 并 且 每 个 长 度 字段 是 3 FW, ERU (或 加 密 的 主 密 铀 ) 的 第 一 个 和 
最 后 一 个 字 节 的 值 是 什么 ? 

e 客户 加 密 的 握手 报 文 考虑 了 多 少 SSL 记录 ? 

IRF ae de Fie BIR Sb SSL 记录 ? 
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( Wireshark mp 截图 的 重印 获得 Wireshark 基金 会 的 许可 ) 


P20. 8.6.1 节 中 表明 ， 不 使 用 序号 ，Trudy (一 名 中 间 人 ) 能 够 在 一 个 SSL 会 话 中 通过 互 换 TCP 报 文 段 实 

施 破坏 。Trudy 能 够 通过 删除 一 个 TCP 报 文 段 做 某 种 类 似 的 事情 吗 ? 在 该 删除 攻击 中 ， 她 宕 要 做 什 
么 才能 成 功 ? 它 将 具有 什么 影响 ? 

. 假定 Alice 和 Bob 通过 一 个 SSL 会 话 通 信 . 假定 一 个 没有 任何 共享 密 钥 的 攻击 者 ， 在 某 分 组 流 中 插 
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p22 


P24. 


P25. 


P26. 








人 一 个 假冒 的 TCP 报 文 段 ， 该 报 文 段 具 有 正确 的 TCP 检验 和 及 序号 (以 及 正确 的 IP 地 址 和 端口 

写 ) 在 接收 侧 SSL 将 接受 该 假冒 分 组 并 传递 载 衙 给 接收 应 用 程序 吧 ? 为什么? 

下 列 是 有 关 图 8-28 的 判断 题 . 

a fE 172. 16. 1/24 中 的 主机 向 一 台 Amazon. com 服务 器 发 送 一 个 数据 报时 ， 路 由 器 RI 将 使 用 
IPsec 加 密 该 数据 报 : 

b. {YE 172. 16. 1/24 中 的 主机 癌 在 172. 16. 2/24 中 的 主机 发 送 一 个 数据 报时 ， 路 由 顷 RI 将 改变 该 
PP 数据 报 的 源 和 目的 地 址 : 

c. 假定 在 172. 16. 1/24 中 的 主机 向 在 172. 16. 2/24 中 的 Web 服务 顷 发 起 一 个 TCP 连接 。 作 为 此 次 连 
接 的 一 部 分 ， 由 RI 发 送 的 所 有 数据 报 将 在 IPv4 首部 字段 最 左边 其 有 协议 写 50 

d. pee 从 在 172. 16. 1/24 中 的 主机 向 在 172. 16. 2724 中 的 主机 发 送 一 个 TCP 报 文 段 ， 假 定 对 该 报 文 

段 的 应 答 玉 失 了 ， 因 此 TCP 重新 发 送 该 报 文 段 。 因 为 IPsec 使 用 序号 ，R1 将 不 重新 发 送 该 TCP 

报 MF 


23. FBP 8-28 中 的 例子 .假定 Trudy 是 中 间 人 ， 她 能 够 在 从 RI 和 R2 发 出 的 数据 报 流 中 插入 数据 报 


作为 重 放 攻 击 一 部 分 、Trudy 发 送 一 个 从 RI 到 R2 发 送 的 数据 报 的 元 余 副 本 。R2 将 解密 该 元 余 的 数 

据 报 并 将 其 转发 进 分 支 机 构 网 络 吗 ”和 如果 不 是 ,详细 描述 R2 如 何 检测 该 元 余 的 数据 报 

aS BS i WEP 协议 。 其 密 钥 是 4 比特 ，LV 是 2 比特 。 当 产生 密 钥 流 时 ，1V 被 附加 到 密 钥 的 后 面 . 

假定 共享 的 密 铀 是 1010。 密 钥 流 的 4 个 可 能 输入 如 下 : 

101000: 001010110101010100101 1010100100-:- 

101001: 1010011011001010110100100101101-:- 

101010: 00011010001 11100010100101001111-- 

101011: 1111101010000000101010100010111--- 

假定 所 有 报 文 都 是 8 比特 长 。 假定 ICV (完整 性 检查 ) 是 4 比特 长 ， 并 且 通 过 用 数据 的 后 4 be 

或 数据 的 前 4 比特 来 计算 。 假 定 该 伪 WEP 分 组 由 3 个 字段 组 成 : 首先 是 TV 子 段 ， 然 后 是 报 文 字段 ， 

最 后 是 ICV 字段 ， 这 些 字 段 中 的 某 些 被 加 密 。 

a 我 们 希望 使 用 IM = 11 A WEP 发 送 报 文 m =10100000, 在 这 3 个 WEP 字段 中 将 有 什么 样 的 值 ? 

b. 说 明 当 接收 方 解 窗 该 WEP 分 组 时 ， 它 恢复 报 文 和 TCYV ， 

c. 假定 Trudy 截获 了 一 个 WEP 分 组 (并 不 必要 使 用 JIV =1) 并 要 在 向 接收 方 转发 前 修改 该 分 组 ， 
假定 Trudy 翻转 了 第 一 个 ICV 比特 ”假定 Trudy 并 不 知道 用 于 任何 的 帘 钥 流 ， 则 Trudy 也 必须 
翻转 哪些 其 他 比特 ,使 得 接收 到 的 分 引 ye ICV 检查 ? 

d 通过 修改 (a) 中 WEP 分 组 中 的 比特 ,解密 所 生成 的 分 组 ， 并 验证 完整 性 检查 来 评价 你 的 

对 于 尽 可 能 限制 但 能 实现 下 列 功能 的 一 侣 有 状态 防火 墙 ， PE Eo eta te Al KE DE Ke 

a. 允许 所 有 的 内 部 用 户 与 外 部 用 户 创 建 Telnet 会 话 。 

b. 允许 外 部 aei 作 司 位 于 222. 22. 0. 12 的 Web 站 点 ， 

c. APU BARS ETA A jii AUR Yi at 

内 部 网 络 为 222. 22/16. 在 你 的 答案 中 . 假设 连接 表 当 前 缓存 了 3 个 从 内 加 外 的 连接 ， 你 再 要 虚构 

适当 的 趾 地 址 和 端口 号 . 

假设 Alice 要 使 用 TOR 类 似 的 服务 访问 Web 站 点 activist. com 该 服务 使 用 两 个 不 串通 的 代理 服务 器 

Proxy! 和 Proxy2 Alice 首先 从 茶 pd 获得 对 Proxyl 和 Proxy2 的 证 书 (每 个 部 包含 一 个 公 

A). HK (K: O, K O MK, 表示 加 密 / 解 密 时 所 使 用 的 RSA 公 铀 和 RSA 私 铂 


a. 使 用 一 幅 时 厅 图 ， 提 供 一 个 ee 协议 允许 Alice 创建 一 个 用 于 Proxyl 的 共享 会 话 密 


H So S,(m) 表示 为 使 用 共享 密 钥 S$, 对 数据 m IE SREB 
b. 使 用 时 序 图 ， 提 供 一 个 ( 尽 可 能 简单 的 ) 协议 允许 Alice 创建 一 个 对 于 Proxy2 的 共享 会 话 密 钥 
S, ， 有 而 不 回 Proxy2 透露 她 的 IP 地 址 . 
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c 现在 假设 创建 了 共享 密 钥 $, 和 -使 用 时 序 钠 提供 一 个 协议 CS AE f PL AS 2S A E A 
Bh). AWMF Alice 从 activist. com 请 求 一 个 html 页 面 而 不 向 Proxy? iĝ 5h 409 IP ebk, TAL 
不 向 Proxy] 透露 她 正在 访问 哪个 站 点 。 你 的 图 应 当 终 止 在 一 个 HTTP 请 求 到 达 activist. com 


Si Wireshark 实验 


在 这 个 实验 中 (与 本 书 配套 的 Web 站 点 有 可 用 资源 ) ， 我 们 研究 安全 套 接 层 (SSL) 协议 .8.6 DE 
过 ， 使 用 SSL an TCP 连接 更 为 安全 ， 为 了 使 因特网 事务 安全 ， 实 践 中 广泛 应 用 了 了 SSL, 在 本 实验 中 我 
们 关注 经 TCP 连接 发 送 的 SSL 记录。 我 们 将 试图 对 每 个 记录 定 界 和 分 类 ,日 标 是 理解 每 个 记录 的 工作 原 
理 和 工作 过 程 ， 我 们 人 研究 各 种 SSL 记录 类 型 以 及 在 SSL 报 文中 的 字段 。 通 过 分 析 你 的 主机 与 某 电 子 商 务 
服务 信之 间 发 送 的 SSL 记 表 的 足迹 来 做 这 些 事情 . 


Si IPsec 实验 


在 这 个 实验 中 (与 本 书 配套 的 Web 站 点 有 可 用 资源 ) ， 我 们 将 探讨 如 何在 linus 装置 之 间 创 建 IPsec 
SA， 你 能 够 用 两 个 普通 的 linux 装置 做 该 实验 部 分 ， 每 个 装置 配 有 一 块 以 太 网 适 配 赫 . 但 于 实 
验 的 第 二 部 分 ， 你 将 再 要 4 个 linux 装置 ,这些 装 壮 每 个 都 具有 两 块 以 太 网 适 配 圳 .在 该 实验 的 第 二 部 
分 ， 你 将 在 隆庆 模式 中 使 用 ESP 协议 创建 IPsec SA. 你 做 实验 过 程 是 : 先 人 工 创 建 SA， 然 后 让 IKE 创 
建 SA 


人 物 专访 


Steven M. Bellovin 在 位 于 新 泽 西 州 Florham Park 的 AT&T 实验 研究 所 的 
网 络 服务 研究 实验 室 工 作 多 年 后 ， 成 为 了 哥伦比亚 大 学 的 教师 ， 他 的 研究 
重点 是 网 络 和 安全 ， 以 及 将 两 者 有 机 结合 起 来 19955 年 ， 因 创立 了 
Usenet， 即 第 一 个 连接 两 个 或 多 个 计算 机 并 允许 用 户 共享 信息 和 参与 讨论 
的 新 闻 组 交换 网 络 ， 而 被 授 子 Usenix 终生 成 就 奖 。Steven 也 是 国家 工程 学 
会 的 当选 成 员 . 他 获得 了 哥伦比亚 大 学 的 学 士 学 位 和 位 于 Chapel Hill 的 北 
卡罗来纳 大 学 的 博士 学 位 








e 什么 原因 使 您 决定 专注 于 网 络 安全 领域 的 人 研究? 

听 起 来 可 能 很 奇怪 ， 但 是 答案 却 很 简单 : 只 是 因为 感 兴趣 而 已 ,我 以 前 的 
背景 是 从 事 系 统 编程 和 系统 管理 ， 这 很 自然 就 发 展 到 安全 领域 了 。 而 且 我 一 直 对 通信 很 感 兴趣 ， 这 可 以 
追 淹 到 我 还 在 上 大 学 时 ， 就 兼职 做 系统 编程 方面 的 工作 

我 在 安全 领域 的 工作 持续 受到 两 个 因素 的 激励 : 一 个 是 希望 计算 机 有 用 ， 这 意味 着 它们 的 功能 不 会 
pa ` 是 布 望 保护 隐私 。 

e 当初 您 在 研发 Usenet 时 ,您 对 它 的 康 景 是 什么 ”现在 呢 ? 

nt la 一 种 能 够 在 全 国 范围 内 讨论 计算 机 科学 和 计算 机 编程 的 手段 ， 考 虑 了 用 于 事务 
管 管理 和 广告 销售 等 目的 的 许多 本 地 使 用 情况 。 事实 上 ， 我 最 初 的 预测 是 ， 每 天 从 至 多 50 ~ 100 个 站 点 有 
| ~2 tex 但 是 实际 增长 是 与 人 相关 的 主题 方面 ,包括 (但 不 限于 ) 人 与 计算 机 的 相互 作用 -这 么 多 
年 来 ， 我 如 次 的 新 闻 组 有 ree. woodworking 以 及 sci. crypt 

(ESE PP RIE 上、 网 络 新 闻 已 经 被 Web 取代- 如 果 现 在 要 我 再 设计 它 的 话 ， 就 会 和 那 时 的 设计 大 不 相 
同 了 ,但 是 它 仍然 是 沟通 对 某 一 主题 感 兴趣 的 大 量 读者 的 一 种 极 好 手段 ， 而 不 必 依 理 特 定 的 Web 站 点 

e 是 耕 有 人 给 过 您 专业 上 的 启示 和 灵感 ?以 什么 样 的 方式 呢 ? 

Fred Brooks 教授 对 我 的 专业 生涯 影 响 重 大 。 他 是 位 于 Chapel Hill 的 北 卡罗来纳 大 学 计算 机 科学 系 的 
创立 省 和 原 系 主任 ， few IBM S/360 和 057/360 团队 的 管理 者 ,他 也 是 “The Mythical Man Mouth” 


Steven M. Bellovin 
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(《 人 月 神话 》) 的 作者 。 最 重要 的 是 ， 他 教 给 我 们 展望 和 折 中 的 方法 ， 即 如 何在 现实 世界 环境 中 观察 问 
题 【 不 论 这 个 现实 世界 比 理论 上 的 要 复杂 多 少 倍 ) ， 以 及 在 设计 一 种 解决 方案 时 如 何平 衡 竞 争 各 方 的 利 
座 。 大 部 分 计算 机 工作 部 是 工程 性 的 ， 正 确 折 中 的 艺术 能 够 满足 许多 相 矛 盾 的 目标 ， 

e 您 对 未 来 的 联网 和 安全 性 的 展望 是 什么 ? 

到 目前 为 止 ， 我 们 所 有 具有 的 安全 性 大 多 来 日 隔离 。 例 如 ,防火墙 的 工作 是 通过 切断 某 些 机 如 和 服务 
实现 的 ， 但 是 我 们 正 处 在 增加 连通 性 的 时 代 ， 这 使 得 隔离 变 得 更 为 困难 ,更 糟糕 的 是 ， 我 们 的 生产 性 系 
统 要 求 的 还 不 止 是 分 离 的 部 件 ， 而 而 要 通过 网 络 将 它们 互联 起 来 .我 们 面临 的 最 大 挑战 之 一 是 使 所 有 都 

e 您 认为 在 安全 性 方面 已 经 取得 的 最 大 进展 是 什么 ?未 来 我 们 还 能 有 多 大 作为 ? 

至 少 从 科学 上 上 讲 ， 我 们 知道 了 密码 学 的 原理 。 这 是 非常 有 帮助 的 . 但 是 多 数 安全 性 问题 因为 其 代码 
错误 成 推 而 成 为 非常 困难 的 问题 . 事实 上 ， 它 是 计算 机 科学 中 悬而未决 的 老 问 题 ， 并 且 我 认为 该 问题 仍 
RIFE. PEAR TE POPU: 当 我 们 不 得 不 使 用 不 安全 的 组 件 构建 安全 的 系统 时 ， 如 何 才能 让 系统 安全 . 
我 们 而 对 人 硬件 故障 已 经 能 够 解决 可 靠 性 问题 了 ; 面 对 安 全 性 问题 ， 我 们 是 否 能 够 做 到 这 一 点 呢 ? 

。 对 于 从 事 因特网 和 网 络 安全 的 学 生 们 ， 您 有 何 忠告 ? 

学 习 各 种 安全 机 制 是 件 容 易 的 事 。 学 习 如 何 “ 思 维 多 疑 ”是 困难 的 。 你 必须 记 住 概率 分 布 在 下 列 场 
合并 不 适用 ， 即 攻击 者 能 够 发 现 不 可 能 的 情况 。 细 市 情况 不 胜 枚 举 。 


Computer Networking; A Top-Down Approach, Sixth Edition 


网 络 管 理 


通过 本 书 前 8 章 内 容 的 学 习 ， 我 们 现在 已 经 得 知 网 络 是 由 许多 复杂 的 、 交 互 的 便 件 和 
软件 实体 组 成 的 ， 它 们 包括 链 路 、 交 换 机 、 路 由 需 、 主 机 和 其 他 由 网 络 物理 部 件 组 成 的 设 
备 ， 还 包括 控制 和 协调 这 些 设备 的 许多 协议 〈 以 硬件 和 软件 形式 出 现 )。 当 一 个 机 构 将 数 
以 百 计 或 数 以 千 计 的 这 些 部 件 拼 装 在 一 起 成 为 一 个 网 络 时 ， 出 现 如 下 一 些 现 象 将 是 不 足 为 
奇 的 : 网 络 部 件 偶尔 出 现 故障 ， 网 络 元 素 配 置 错误 ， 网 络 资源 过 度 使 用 ， 或 网 络 部 件 完全 
“崩溃 ”( 例如， 电缆 被 切断 ， 或 一 听 汽 水 翻 倒 在 一 台 路 由 费 上 )。 网络 管理 员 的 工作 是 保 
持 该 网 络 “ 局 动 和 运行 ”， 他 们 必须 能 够 对 这 些 问 题 做 出 反应 ， 最 好 是 避免 它们 的 出 现 ， 
由 于 成 千 上 万 的 网 络 部 件 可 能 散布 在 广泛 的 区 域 中 ,在 网 络 运营 中 心 (NOC) 的 网 络 管理 
员 显 然 震 要 工具 来 监视 、 管 理 和 控制 网 络 .在 本 章 中 ,我 们 将 探讨 网 络 管理 员 在 网 络 管理 
任务 中 所 使 用 的 体系 结构 、 协 议和 信息 库 
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在 深入 研究 网 络 管理 之 前 ， 我 们 首先 考虑 一 些 “ 真 实 世界 ”的 非 网 络 环境 中 的 几 个 说 
明 性 例子 ， 即 在 一 个 复杂 系统 中 ， 管 理 人 员 要 对 系统 中 交互 的 部 件 进行 监测 、 管 理 和 控 
制 。 发 电厂 具有 控制 室 ， 其 中 有 标 度 盘 、 测 量 仪 和 灯光 ， 它 们 用 来 监视 远程 的 阀门 、 管 
子 、 容 器 和 其 他 工厂 设备 的 状态 (温度 、 压 力 、 流 量 )。 这 些 设备 允许 操作 员 监 测 该 工厂 
的 许多 部 件 ， 并 当 故 障 到 来 时 能 向 操作 员 告 警 (用 周知 的 红色 闪光 敬 灯 )。 工 厂 操 作 员 采 
取 措 施 来 控制 这 些 部 件 。 类 似 地 ， 飞 机 驾驶 室 的 安排 将 使 飞行 员 能 够 监视 和 控制 飞机 的 许 
多 部 件 。 在 这 两 个 例子 中 ,“ 管 理 人 员 ” 监 测 远 程 设备 并 分 析 相 关 数 据 ， 以 确保 这 些 设备 
能 够 使 用 ， 并 在 所 规定 的 限制 中 运行 (例如 ， 核 电厂 的 核反应 堆 心 不 会 很 快 熔化 ， 或 者 飞 
机 的 燃料 不 会 用 完 )， 根据 系统 中 的 变化 或 其 环境 进行 调整 ， 反 应 式 地 控制 系统 ; 以 及 主 
动 式 地 管理 系统 【( 例 如， 通过 检测 趋势 或 异 委 行为 ， 在 出 现 严 重 问 题 之 前 采取 行动 )。 与 
此 类 似 ， 网 络 管理 人 员 要 主动 监测 、 管 理 和 控制 他 们 所 负责 的 系统 。 

在 网 络 发 展 的 初期 ， 计 算 机 网 络 还 处 于 供 研 究 的 初级 阶段 ， 而 不 是 数 千 万 人 每 日 必用 
的 重要 基础 设施 ,“ 网 络 管理 ”还 是 一 个 闻所未闻 的 超前 概念 。 如 果 一 个 人 遇 到 了 网 络 问 
题 ， 他 可 能 多 次 运行 ping 程序 对 该 问题 的 源 进行 定位 ， 接 着 修改 系统 设置 ， 重 新 启动 硬件 
或 软件 ,或 者 打 电 话 让 远程 的 同事 来 做 这 些 事 情 。 (一 个 非常 值得 阅读 的 材料 是 | RFC 
789]: 自 1980 年 10 H 27 H ARPAnet 第 一 次 严重 “ 朋 演 ”后 很 入 ， 部 没有 可 供 使 用 的 网 
络 管理 工具 ， 网 络 管理 员 努 力 工作 以 恢复 有 衣 浊 的 系统 ， 并 试图 理解 这 次 朋 江 的 原因 )。 随 
着 公共 因特网 和 专用 内 联网 从 小 型 网 络 成 长 成 为 巨大 的 全 球 基 础 设施 ， 更 为 系统 地 管理 这 
些 网 络 中 的 大 量 人 硬件 和 软件 组 件 的 需求 也 就 变 得 更 为 重要 了 . 

为 了 激发 读者 学 习 网 络 管理 的 热情 ， 我 们 的 讨论 将 从 一 个 简单 的 例子 开始 . 图 9-1 k 
示 了 一 个 小 型 网 络 ， 该 网 络 由 3 台 路 由 需 和 奋 干 台 主 机 及 服务 器 组 成 。 即 使 在 这 样 一 个 简 
单 的 网 络 中 ， 在 许多 情况 下 网 络 管理 员 也 从 使 用 适当 的 网 络 管理 工具 中 得 到 许多 益处 : 





图 9-1 一 个 简单 的 说 明 网 络 管理 用 途 的 场景 


检测 主机 或 路 由 器 接口 卡 的 故障 。 利 用 适当 的 网 络 管理 工具 ， 一 个 网 络 实体 〈 例 
UKAE A) 可 以 向 网 络 管理 员 报 告 它 的 一 个 接口 卡 已 经 失效 。( 这 无 疑 比 一 个 发 
把 的 用 户 打 电话 回 网 络 运营 中 心 (NOC) 抱怨 网 络 连接 已 经 中 断 要 好 得 多 !) 主动 
监测 和 分 析 网 络 流量 的 网 络 管理 员 可 以 通过 事先 检测 到 接口 中 存在 问题 ， 并 在 它 
发 生 故障 之 前 换 掉 它 ， 这 样 会 给 原来 要 发 怒 的 用 户 留 下 非常 深刻 的 印象 。 例 如 ， 
如 果 该 管理 员 注意 到 由 这 块 即将 失效 的 接口 所 发 送 的 帧 中 的 检验 和 差错 增加 ， 就 
可 能 发 现 接口 卡 存在 的 问题 。 

主机 监测 。 在 这 种 场合 下 ， 该 网 络 管理 员 可 以 进行 周期 性 地 检查 ， 看 是 否 所 有 的 
网 络 主机 开机 和 和 运行。 同样 ， 该 网 络 管理 员 通 过 在 用 户 报 告 之 前 提前 对 问题 (如 
主机 停机 ) 做 出 响应 ， 这 也 会 给 网 络 用 户 留 下 深刻 的 印象 。 

监测 流量 以 帮助 部 署 资源 。 例 如 ， 网 络 管理 员 可 以 通过 监测 源 到 目的 地 流量 的 模 
式 并 且 通 告 在 LAN 网 段 间 切换 服务 疹 ， 使 得 器 越 多 个 LAN 的 流量 大 大 减少 。 厂 不 
增加 新 设备 成 本 而 取得 更 好 的 网 络 性 能 ， 是 件 皆 大 欢喜 的 事情 。 类 似 地 ， 通 过 监 
测 链 路 利用 率 ， 网 络 管理 员 可 能 决定 某 条 LAN 网 段 或 通 往外 部 的 链 路 将 要 过 载 ， 
因此 应 当 提供 更 高 带宽 的 链 路 〈 当然 要 增加 成 本 ) 。 网 络 管理 员 也 可 能 希望 在 出 现 
链 路 拥塞 等 级 超过 给 定 国 值 的 情况 下 ， 自 动 得 到 通知 ， 使 得 在 拥塞 变 得 严重 之 前 ， 
配备 更 大 带宽 的 链 路 。 

检测 路 由 选择 表 中 的 快速 变化 。 路 由 闸 动 (route flapping) 即 路 由 选择 表 内 容 的 经 
常 变化， 可 能 表明 路 由 选择 的 不 稳定 或 路 由 器 配置 不 正确 。 那 些 不 正确 地 配置 了 
路 由 天 的 网 络 管理 员 ， 无 疑 硕 望 自 己 在 该 网 络 准 痪 之 前 发 现 这 个 错误 。 
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e 服务 等 级 协定 的 监测 ,服务 等 级 协定 (Service Level Agreement, SLA) 2, 1E 
义 了 特定 的 性 能 测度 和 网 络 提 供 商 提供 的 相对 于 这 些 性 能 测度 的 可 接受 性 能 等 级 
| Huston 1999a | Verizon 和 Sprint 是 两 个 网 络 提 供 商 ， 它 们 与 其 他 ISP 一 样 回 其 用 
户 提供 确保 的 SLA [AT&T SLA 2012; Verizon 2012 ]， 这 些 SLA 包括 服务 可 用 性 
(WER). 、 时 延 、 吞 吐 量 和 断 线 通知 要 求 . 很 显然 、 如 果 性 能 标准 是 网 络 提供 疝 
和 其 用 户 间 服务 协定 的 一 部 分 的 话 ， 那 么 测量 和 管理 性 能 对 于 网 络 管理 只 是 十 分 
Ae AY 
e 入 侵 检 测 。 当 网 络 流 量 来 月 一 个 可 疑 源 或 预定 要 流 癌 一 个 可 疑 源 (例如 ， 主 机 
端口 号 ) 时 ， 网 络 管理 员 可 能 和 硕 望 得 到 提示 。 类 似 地 ， 网 络 管理 员 可 能 希望 检测 
(并 在 许多 情况 下 过 滤 ) 基 类 流量 的 存在 (例如 ， 源 路 由 选择 分 组 或 指 回 给 定 主 
机 的 大 量 SYN 分 组 ) ， 这 被 认为 具有 安全 性 攻击 类 型 的 特征 ， 我 们 已 在 第 8 pep 
讨论 对 
国际 标准 化 组 织 (ISO) 已 经 建立 了 一 个 网 络 管理 模型 ,该 模型 对 于 将 上 述 各 种 各 样 
的 情况 放置 于 更 为 结构 化 的 框架 中 是 有 用 的 。 该 模型 定义 了 网 络 管理 的 5 个 领域 . 
e 性 能 管理 (performance management). 性 能 管理 的 目标 是 量化 、 测 量 、 报 告 、 分 析 
和 控制 不 同 网 络 部 件 的 性 能 ( 如 利用 率 和 在 吐 量 )。 这 些 部 件 包括 各 个 设备 (如 
链 路 、 路 由 硕 和 主机 ) 以 及 如 通过 某 网 络 的 路 径 那 样 的 闯 到 痛 抽 和 象 。 我 们 很 快 将 
会 看 到 ， 如 简单 网 络 管理 协议 (Simple Network Management Protocol, SNMP ) 
LRFC 3410] 这 样 的 协议 标准 在 因特网 性 能 管理 中 起 看 最 午 杰 的 作用 ， 
o 故障 管理 (fault management). 故障 管理 的 目标 是 记录 、 检 测 和 啊 应 网 络 中 的 故障 
情况 。 故障 管 理 和 性 能 管理 之 间 的 区 别 是 相当 模糊 的 。 我 们 能 够 认为 故 了 管理 是 
对 暂时 性 网 络 故 障 (例如 ， 链 路 、 主 机 及 路 申 融 硬件 或 软件 的 停 转 ) 的 及 时 处 理 ， 
而 性 能 管理 采取 更 为 长 期 的 观点 ， 面 对 变化 的 流量 要 求 和 偶尔 的 网 络 设备 故障 ， 
提供 可 接受 的 性 能 等 级 。 与 性 能 管理 一 样 ，SNMP 协议 在 故障 管理 中 起 着 最 重要 的 
作用 。 
e 配置 管理 (configuration management) ， 配 置 管 理 人 允许 网 络 管 理 员 跟 足 被 管理 网 络 
中 的 那些 设备 ， 跟 踪 这 些 设 备 的 便 件 和 软件 配置 有关 基 于 IP 网 络 的 配置 管理 和 
要 求 的 概述 可 参见 [RFC 3139 ] 。 
e 账户 管理 (accounting management ) 。 账 户 管理 允许 网 络 管理 员 定 义 、 记 录 、 控 制 
用 户 和 设备 访问 网 络 资源 。 限 额 使 用 、 基 于 使 用 的 收费 和 分 配 资 源 访问 权限 都 属 
- 于 账户 管理 的 范围 。 
e 安全 管理 (security management)。 安 全 管理 的 目标 是 根据 某 些 定义 明确 的 策略 控 
制 对 网 络 资源 的 访问 。 我 们 在 8. 3 节 中 讨论 的 密 钥 分 发 中 心 是 安全 管理 的 一 部 分 ， 
使 用 防火 墙 监视 和 控制 网 络 的 外 部 接 入 点 既是 我 们 在 8.9 节 中 讨论 的 一 个 主题 ， 
也 是 本 章 的 一 个 重要 部 分 . 
ERP, 我 们 仪 将 涉及 网 络 管理 的 入 门 知识 。 我 们 有 意识 地 关注 有 限 的 范围 ， 讨 论 
网 络 管理 的 基础 设施 ， 即 总 体 体系 结构 、 网 络 管理 协议 和 信息 库 ， 网 络 管理 员 将 通过 该 信 
晨 库 保 持 网 络 正常 运行 。 我 们 将 不 涉及 网 络 管理 员 的 决策 过 程 ， 其 中 网 络 管理 员 必须 对 传 
送 到 NOC 的 网 络 信息 进行 规划 、 分 析 和 做 出 啊 应 。 在 这 个 领域 中 ， 诸 如 故障 标识 和 管理 
| Katzela 1995; Medhi 1997; Labovitz 1997; Steinder 2002; Feamster 2005; Wu 2005; Teix- 
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eira 2006 | 、 异 第 检测 | Lakhina 2004; Lakhina 2005; Barford 2009] 及 更 多 的 主题 正在 研 
IEP. RIEA R E WRS EEE | Saydam 1996; RFC 3052], amis. JRI ae 
容量 和 其 他 为 满足 某 企业 特定 任 务 的 服 务 要求 所 需要 的 计算 /通信 资源 . 

一 个 经 稼 被 问 到 的 问题 是 : 什么 是 网 络 管理 ?我 们 上 面 的 讨论 是 从 网 络 管理 的 需求 和 
展示 几 个 网 络 管理 应 用 的 角度 进行 的 。 在 这 节 中 ， 我 们 将 用 一 个 句子 (虽然 它 相 当 宛 长 ) 
来 概括 网 络 管理 的 定义 [Saydam 1996 ] 。 

“网 络 管理 包括 了 硬件 、 软 件 和 人 类 元 素 的 设置 、 综 合 和 协调 ， 以 监视 、 测 

试 、 轮 询 、 配 置 、 分 析 、 评 价 和 控制 网 络 及 网 元 资源 ， 用 合理 的 成 本 满足 实时 

性 、 运 党 性 能 和 服务 质量 的 要 求 。” 

这 人 句 话 里 绕 口 ， 但 它 是 一 个 好 而 易于 使 用 的 定义 。 在 后 面 的 内 容 中 ， 我 们 将 为 这 个 相 
当 本 质 的 网 络 管理 定义 增加 一 些 内 容 。 


9. 2 网络 管理 的 基础 设施 


我 们 在 前 面 一 市 中 看 到 ， 网 络 管理 要 求 具有 “监视 、 测 试 、 轮 询 、 配 置 …… FIPE 
制 ” 网 络 中 的 便 件 和 软件 组 件 的 能 力 。 因 (eenkeh eae 式 的 ， 这 将 在 最 低 程度 
上 要 求 网 络 管 理 员 能 够 从 远程 的 一 个 实体 收集 数据 〈( 例 如， 为 了 监视 目的 ) ， 并 入 
程 实体 的 改变 〈 例 如， 控制 它 ) 。 一 个 人 类 的 类 比例 子 将 才 下 助 我 们 理解 网 络 知 FE JIT it 
的 基础 设施 . 

假定 你 是 一 个 在 全 世界 具有 分 六 机 构 的 大 机 构 的 领导 。 你 的 工作 是 确保 该 机 构 的 各 部 
分 正常 运转 。 你 将 如 何 做 到 这 一 点 呢 ?” 至 少 ， 你 将 周期 性 地 从 这 些 分 支 机 构 以 报告 的 形式 
收集 数据 ， 并 且 定 量 地 测算 各 种 活动 、 EPERAIMA. MERS (DREA) 被 明确 地 
告知 在 这 些 分 支 机 构 中 的 某 个 机 构 存 在 一 个 问题 ; 该 分 支 机 构 经 理 是 一 个 希望 向 公司 高 层 
ERA (也许 希望 得 到 你 的 位 子 )， 他 也 许 主动 同 你 提供 报告 ， 指 出 在 其 领导 的 分 支 机 构 
中 工作 进行 得 十 分 顺利 。 你 会 详细 地 审查 收 到 的 报告 ,希望 看 到 各 地 机 构 正 常 运行 ， 但 无 
镍 发 现 了 雷 引 起 你 重视 的 问题 。 你 可 能 与 存在 问题 的 分 文 机 构 发 起 一 对 一 对 话 ， 为 了 搞 清 
该 问题 而 收集 更 多 的 数据 ， 然 后 同 该 分 支 机 构 的 经 理 传达 一 个 行政 命令 (“纠正 这 
件 事 ! )。 

障 合 在 这 个 非常 普通 的 人 类 活动 背后 的 是 一 个 控制 机 构 的 基础 设施 ， 老 板 (你 )、 被 
控制 的 远程 站 操 〈 分 文 机 构 ) 、 你 的 远程 代理 〈 分 文 机 构 的 经 理 ) 、 通 信 协 议 (用 于 传输 
标准 的 报告 和 数据 或 一 对 一 对 话 ) 和 数据 〈 报 告 内 容 以 及 各 种 活动 、 生 产 率 和 预算 的 定量 
舍 算 ) 。 在 人 类 机 构 管理 中 的 这 些 部 件 ， 每 个 都 在 网 络 管理 中 有 对 应 的 东西 。 

网 络 管理 系统 的 体系 结构 在 概念 上 等 同 于 这 个 简单 的 人 类 组 织 的 类 比例 子 。 网 络 管 
统 域 对 于 网 络 管理 体系 结构 的 各 种 组 件 都 有 自己 的 特定 术语 ， 因 此 我 们 ; setae 
党 。 如 图 9-2 中 所 示 ， 网 络 管理 体系 结构 有 三 个 重要 组 件 : 一 个 管理 实体 (在 上 述 类 比 中 
ER, BR), ENRERE (LU) 和 一 个 网 络 管理 协议 。 

管理 实体 (managing entity) 是 一 个 应 用 程序 ， 通常 有 人 位 于 其 中 ， 该 程序 运行 在 网 
络 运 营 中 心 (NOC) 的 集中 式 网 络 管理 工作 站 上 。 管 理 实体 是 执行 网 络 管理 活动 的 所 在 
地; 它 控制 网 络 管理 信息 的 收集 、 人 处 理 、 分 析 和 /或 显示 。 正 是 在 这 里 ， 发 起 控制 网 络 行 
为 的 动作 并 且 人 类 网 络 管理 员 与 网 络 设备 打交道 。 
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5] 9-2 网 络 管理 体系 结构 的 主要 组 件 


soir | (managed device) 是 网 络 装备 的 一 部 分 (包括 它 的 软件 ) ， 位 于 被 管理 的 网 
络 中 。 它 相当 于 我 们 上 述 类 比 中 的 分 支 机 构 。 一 个 被 管 设 备 可 能 是 主机 、 路 由 器 、 网 桥 、 
eek te. TIEN AL ake ya di fe a) ae. 在 一 个 被 管 设 备 中 ， 有 几 个 所 谓 被 管 对 象 (managed 
object) :这些 被 管 对 象 是 被 管 设 备 中 硬件 的 某 些 有 效 部 分 (如 一 块 网 络 接口 卡 ) 和 某 些 便 
件 与 软件 的 配置 参数 集合 (如 RIP 这 样 的 域内 路 由 选择 协议 )。 在 我 们 的 人 类 的 类 比 中 ， 
被 管 对 象 可 能 是 分 文中 的 一 个 部 门 。 这 些 被 管 对 象 具 有 与 它们 相关 的 部 分 信息 ， 这 些 信息 
收集 在 管理 信息 库 (MIB) 中 ; 我 们 将 看 到 ， 这 部 分 信息 的 值 可 供 管理 实体 利用 (并且 在 
许多 情况 下 能 够 被 它 设置 )。 在 前 面 的 人 类 的 类 比 中 ，MIB 对 应 于 在 分 支 机 构 和 中 心 办 事 
处 之 则 交换 的 定量 数据 (活动 性 、 和 生产率 和 预算 的 度量 ， F ELEY HES VEE WS DCL MIB). 
我 们 将 在 9. 3 节 中 详细 学 习 MIB。 最 后 ， 在 每 个 被 管 设备 中 还 驻 留 着 网 络 管理 代理 (net- 
work management agent) ， 它 是 运行 在 被 管 设备 中 与 管理 实 Miia 的 进程 ， 在 管理 实体 的 命 
令 和 控制 之 下 ， 在 被 管 设 备 上 采取 本 地 动作 。 该 网 络 管理 代理 对 应 于 上 述 类 比 中 的 分 支 机 
构 经 理 。 

网 络 管理 体系 结构 的 第 三 部 分 是 网 络 管理 协议 (network management protocol), 该 协 
以 运行 在 管理 实体 和 被 管 设备 之 间 ， 人 允许 管理 实体 查询 被 管 设 备 的 状态 ， 并 经 过 其 代理 间 
接地 在 这 些 设备 上 及 取 行 动 。 代 理 能 够 使 用 网 络 管理 协议 向 管理 实体 通知 异常 事件 〈 如 组 
件 故 障 或 超过 了 性 能 国 值 )。 重 要 的 是 注意 到 网 络 管理 协议 自己 不 能 管理 网 络 。 恰 恰 相 反 ， 
亡 为 网 络 管理 员 提 供 了 一 种 用 来 管理 (“监视 、 测试 、 轮 询 、 配 置 、 分 析 和 控制 ”) 网 络 
的 工具 。 这 是 一 种 细微 但 却 重要 的 区 别 。 

尺 管 网 络 管理 基础 设施 概念 上 简单 ， 但 一 个 人 经 常 被 网 络 管理 行 话 如 “管理 实体 ”、 

被 管 设备 ”、“ 管 理 代理 ”和 “管理 信息 库 ” 等 搞 得 一 涉 筋 水 。 例 如 ， 用 网 络 管理 行 话 来 
说 ， 在 简单 的 主机 监视 场景 下 ， 位 于 “被 管 设备 ”中 的 “管理 代理 ”由 “管理 实体 ” 赂 
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容 的 时 候 , 心中 想 着 上 述 人 类 组 织 机 构 的 类 比例 子 一 一 这 个 类 比例 子 与 网 络 管理 有 的 明显 
对 应 ， 将 有 助 于 我 们 的 等 习 

寺 述 有 关 网 络 管理 体系 结构 的 讨论 县 有 一 般 性 ， 能 够 宽 沁 地 应 用 于 一 些 网 络 管理 标准 
和 过 去 若干 年 提出 的 方法 中 。 网 络 管理 标准 成 熟 于 20 世纪 80 年 代 后 期 ， 这 时 推出 了 OSI 
CMISE/CMIP (Common Management Information Services Element/Common Management Infor- 
mation Protocol， 公 共管 理 信息 服务 元 素 / 公 共管 理 信息 协议 ) | Piscatello 1993; Stallings 
1993; Glitho 1998 | 和 | 因特网 SNMP (Simple Network Management Protocol， 简 单 网 络 管理 
协议 ) | RFC 3410; Stallings 1999; Rose 1996 | 两 个 重要 的 标准 | Subramanian 2000 | - 这 
两 个 标 准 的 设计 独立 于 特定 厂商 ad Hn 或 网 络 。 因 为 SNMP WE iit ASE ht te E 2 E 
需求 变 得 十 分 强烈 之 时 ， 所 以 它 得 到 广泛 的 使 用 和 接受 。 今 天，SNMP 已 经 成 为 应 用 和 实 
施 最 为 广泛 的 网 络 管理 框架 。 我 人 - a 下 面 内 容 中 详细 学 习 SNMP. 


实践 原则 


Comcast 的 网 络 运 营 中 心 


Comcast 基于 光纤 的 世界 级 IP 网 络 向 4900 万 个 综合 视频 、 数 据 和 语音 客户 传送 汇 
合 的 产品 和 服务 。Comcast 网 络 和 包括 超过 618 000 英里 的 建设 线路 、138 000 英里 的 光纤 
线路 、30 000 英里 的 主干 、122 000 个 光 结 点 以 及 用 于 Comcast 内 容 交 付 网 络 的 巨 量 存 
储 ， 该 CDN 传递 了 超过 134TB 的 按 需 视频 产品 ，Comcast 网 络 的 每 个 部 分 ， 甚 至 包括 顾 
客 的 家 庭 或 工商 企业 ， 都 由 该 公司 的 运营 中 心 之 一 进行 监视 ， 

Comcast 运营 两 个 国内 网 络 运 营 中 心 ， 这 些 中 心 管理 国内 主干 、 区 域 网 络 、 国 内 应 
用 以 及 支持 语音 、 数 据 和 视频 基础 设施 的 特定 平台 ， 其 中 的 基础 设施 涉及 住宅 、 商 务 和 
大 批 顾 客 ， 此 外 ，Comcast 具有 三 个 Dee eas, 它们 管理 本 地 基础 设施 以 支持 其 所 
有 顾客 .国内 和 分 区 运营 中 心 都 通过 利用 公共 进程 和 系统 ， 以 7 x24 x365 方式 对 其 网 
络 和 产品 性 能 的 所 有 方面 进行 前 摄 性 监视 例如， 在 国家 和 本 地 层面 的 各 种 网 络 事件 具 
有 共同 预定 义 的 安全 性 等 级 、 恢 复 过 程 和 达到 预期 恢复 目标 的 平均 时 间 。 如 果 一 个 本 地 
问题 影响 一 个 站 点 的 运行 ， 国 内 和 分 区 运营 中 心 能 够 相互 支持 。 此 外 ， 国 家 和 分 区 运营 
中 心 具 有 一 个 大 规模 的 虚拟 专用 网 ， 该 虚拟 专用 网 允许 工程 师 安 全 地 接 入 网 络 ， 从 远 地 
执行 前 摄 性 或 反应 性 的 网 络 管理 活动 





这 些 屏 幕 显示 了 支持 关联 、 国 值 管理 和 由 Comeast 技术 人 员 所 使 用 的 标签 
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Comcast 对 网 络 管理 的 方法 涉及 5 个 关键 区 域 : MASI. MM SR. HR SH. 
账户 管理 和 安全 管理 .性 能 管理 (performance management) 关注 于 理解 以 下 方面 : 相对 
于 每 天 的 某 时 间 、 每 周 的 某 天 或 特殊 事件 (例如 ， 拳 击 赛 引 起 的 流量 高 潮 或 支付 事件 )， 
网 络 / 系统 和 应 用 程序 (统称 为 生态 系统 ) 是 如 何 执行 的 。 这 些 预定 义 的 性 能 测度 遍及 
服务 路 径 ， 从 顾客 的 住宅 或 商务 到 整个 网 络 ， 再 到 合 估 人 和 对 等 方 的 接口 点 此外， 为 
确保 该 生态 系统 的 正常 运行 ， 持 续 不 断 地 运行 综合 事务 .故障 管理 (fault management) 
定义 为 检测 、 做 日 志和 理解 可 能 影响 顾客 的 民 第 的 能 力 . Comcast 利用 相关 性 引 蓉 来 适 
当地 确定 某 事 件 的 严重 性 并 采取 适当 的 动作 ， 在 它 影 响 顾客 之 前 消除 或 纠正 潜在 的 问 
题 。 配 置 管理 (configuration management) 确保 该 生态 系统 的 所 有 元 素 都 采用 硬件 和 软 
件 的 适当 版 本 .使 这 些 元 素 维 持 在 它们 萝 峰 的 “黄金 级 ”水 平 ， 有 助 于 它们 避免 无 意识 
HER. 账户 管理 (accounting management) 确保 运营 中 心 明 白 无 误 地 了 解 该 生态 系统 
的 供给 与 利用 ,为 确保 运营 中 心 在 所 有 时 间 都 具有 有 效 地 重 路 由 流量 的 能 力 ， 这 种 功能 
特别 重要 .安全 管理 (security management) 确保 存在 适 2 当 的 控制 ， 确 保 该 生态 系统 得 
到 有 效 的 保护 ， 以 免 受 到 不 适当 的 访问 

网 络 运营 中 心 及 其 所 支持 的 生态 系统 并 非 是 静态 的 。 工 程 和 运营 人 员 要 不 断 地 重新 
评价 预定 义 的 性 能 测度 和 工具 ， 以 确保 满足 顾客 对 良好 运行 的 期 望 


9. 3 ”因特网 标准 管理 框架 


与 SNMP 名 字 所 上 暗示 的 相反 ， 在 因特网 中 进行 网 络 管理 远 比 一 个 在 管理 实体 和 它 的 代 
理 之 则 传递 管理 数据 的 协议 所 涉及 的 内 容 要 多 得 多 ， EO 已 经 比 “ 人 简单” 一 词 所 
暗示 的 要 复杂 得 多 。 妆 前 的 因特网 标准 管理 框架 可 追溯 到 鸽 单 网 关 监 帘 浴 议 一 一 SGMP 
[RFC 1028], SGMP 是 由 一 批 大 学 的 网 络 人 研究 者 、 用 户 和 管理 者 也 设计 的 ， 他 们 在 SGMP Jy 
面 的 经 验 使 他 们 仅 在 数 月 中 设计 、 实 现 和 部 署 了 了 SNMP Lynch 1993 | ， 这 对 于 今天 的 延续 时 
间 相 当 漫 长 的 标准 化 过 程 是 一 种 触动 从 那 时 起 ，SNMP 从 SNMPv1 到 SNMPv2 ， 再 演化 到 最 
近 的 版 本 SNMPv3[ RFC 3410] ， 该 版 本 于 1999 年 4 月 公布 ， 并 于 2002 年 12 月 更 新 . 

当 摘 述 任何 一 种 网 络 管理 的 框 凌 时， 不 可 避免 地 要 涉及 以 下 问题 : 

o 要 监视 什么 〈 从 语义 的 角度 )? 网 络 管理 员 能 够 执行 什么 形式 的 控制 ， 

o 报告 和 /或 交换 的 信息 采用 什么 样 的 格式 ? 

e 交换 这 些 信息 采用 什么 样 的 通信 协议 ” 

回想 前 一 节 中 我 们 人 类 组 织 的 类 比 。 老 板 和 分 支 机 构 经 理 将 需要 认可 用 来 报告 分 支 机 
构 状 态 的 活动 、 生 产 率 和 预算 的 度量 方法 。 类 似 地 ， 他 们 将 需要 认可 老板 能 够 采取 的 拉 施 
(例如 ， 削 减 预算 ， 命 令 分 支 机 构 经 理 改变 该 办 事 处 运作 的 某 些 方面 ， 或 解雇 职员 ALLA 
分 支 机 构 )。 在 较 低 层次 的 细节 方面 ， 他 们 将 需要 认可 数据 报告 iA 例如 ， 报 告 预算 
时 采用 何 种 货币 〈 美元 或 欧元 )? 生产 率 将 以 什么 单位 来 度量 ? 虽然 这 些 可 能 看 起 来 是 微 
不 足 道 的 细节 ， 但 无 论 如 何 它 们 必须 要 达成 一 致 。 最 后 ， 必 须 规 定 信 息 在 总 公司 办 事 处 和 
分 支 机 构 之 间 传 递 的 方式 ( 即 它们 的 通信 协议 ) 。 

因特网 标准 的 管理 框架 可 以 解决 上 面 提出 的 问题 .该 框架 由 4 个 部 分 组 成 : 
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理 信息 表现 为 管理 对 象 的 集合 ， 这 些 对 象 共 同形 成 了 一 个 虚拟 信息 存储 ， 称 之 为 
管理 信息 库 (Management Information Base，MIB ) .一 个 MIB 对 象 可 以 是 一 个 计数 
ar. PAN: 因 IP 数据 报 首 部 差错 而 导致 路 由 融和 技 弃 的 IP 数据 报 的 数量 ， 或 在 以 太 
网 接口 卡 载波 侦 听 到 的 差错 数量 ; 运行 在 一 台 DNS 服务 右上 的 软件 版 本 的 描述 性 
信息 ; 一 个 特定 设备 功能 是 否 正确 的 状态 信息 ; 或 到 一 个 目的 地 的 路 由 选择 路 和 
这 种 协议 相关 的 信息 等 。MIB 对 象 因此 定义 了 由 被 管 设备 维 护 的 管理 信息 。 相 关 
的 MIB 对 象 聚 集 在 MIB 模块 (module) 中 。 在 我 们 人 类 组 织 的 类 比 中 ， 该 MIB 定 
义 了 在 分 文 机 构 和 总 公司 办 事 处 之 问 传 递 的 信息 . 
© 数据 定义 语言 .该 堵 言 被 称 为 管理 信息 绪 构 (SMI). SMI 定义 了 数据 类 型 、 对 象 
模型 ， 以 及 写 人 和 修改 管理 信息 的 规则 。MIB 对 象 用 这 种 数据 定义 语言 进行 定义 。 
在 我 们 人 类 组 织 的 类 比 中 ，SMI 用 于 定义 被 交换 的 信息 格式 的 细节 . 
© 协议 SNMP， 它 用 于 在 管理 实体 和 代理 之 问 传 递 信息 和 命令 ， 代 理 代表 在 被 管 网 
络 设 备 中 的 实体 而 执行 操作 ， 
。 安全 性 和 管理 能 力 。 这 些 能 力 的 增加 代表 了 SNMPv3 在 SNMPv2 基础 上 的 加 强 。 
因特网 管理 体系 结构 采用 模块 化 的 设计 ， 采 用 了 一 种 协议 无 关 的 数据 定义 语言 和 MIB, 
以 及 一 种 MIB 无 关 的 协议 。 有 意思 的 是 ， 这 种 模块 化 的 体系 结构 最 先 提出 的 原因 是 ， 使 基于 
SNMP 的 网 络 管理 易于 问 由 国际 标准 化 组 织 研制 的 网 络 管理 框架 迁移 ， 后 者 是 在 最 初 构想 
SNMP 时 所 提出 的 一 种 竞争 性 的 网 络 管理 体系 结构 。 然 而 ， 这 种 迁移 并 没有 出 现 。 随 着 时 间 
推移 ，SNMP 的 设计 方法 使 它 进行 了 3 个 主要 版 本 的 演化 ， 并 且 人 允许 上 面 讨论 的 SNMP 的 4 
个 主要 部 分 独立 演化 。 显然 ， 过 去 所 作 的 模块 化 决定 是 正确 的 ， 即 使 其 原因 是 错误 的 ! 
在 下 面 的 内 容 中 .我 们 将 更 为 详细 地 学 习 因 特 网 标准 管理 框架 的 这 4 个 主要 组 件 


9.3.1 管理 信息 结构 : SMI 


管理 信息 结构 (Structure of Management Information, SMI) 是 一 个 名 字 相 当 育 特 的 网 络 
管理 框架 的 组 件 ， 从 它 的 名 字 看 不 出 它 的 功能 。SMI 是 用 于 定义 驻 留 在 被 管 网 络 实体 中 的 管 
理 信 息 的 语言 。 为 确保 网 络 管理 数据 的 语法 和 语义 定义 明确 和 无 二 义 性 ， 需 要 这 样 一 种 定义 语 
言 。 注 意 到 SMI 不 是 用 于 定义 被 管 网 络 实 体 中 特定 数据 的 实例 的 ， 而 是 定义 这 种 信息 的 语言 。 
用 于 摘 述 SNMPv3 的 SMI 文档 ( 它 饭 称 为 SMIv2， 这 特别 容 多 让 人 混淆) 征 [RFC 2578; RFC 
2579; RFC 2580 | 。 我 们 以 自 底 向 上 的 方式 来 研究 SMI， 并 从 SMI 中 的 基本 数据 类 型 开始 。 然 后 
我 们 观察 如 何 用 SMI 来 描述 被 管 对 象 ， 以 及 相关 的 被 管 对 象 是 如 何 分 组 而 成 为 模块 的 , 

1. SMI 基本 数据 类 型 

RFC 2578 规定 了 用 于 SMI MIB 模块 定义 语言 中 的 基本 数据 类 型 。 尽 管 SMI1 基于 
ASN. 1 (抽象 语法 记 法 1) [ISO X. 680 2002] 对 象 定义 语言 (参见 9.4 节 ) ， 但 它 已 经 增 
加 了 足够 多 的 SMI 特定 数据 类 型 ， 因 而 可 以 认为 SMI 是 具有 专门 用 途 的 数据 定义 语言 。 在 
RFC 2578 中 定义 的 11 种 基本 数据 类 型 显示 在 表 9-1 中 。 除 了 这 些 标量 对 象 外 ， 还 可 以 使 
用 SEQUENCE OF 结构 也 可 能 将 一 些 有 序 的 MIB 对 象 集合 组 合成 列 结构 ; 细节 请 参见 RFC 
2578 。 对 多 数 读 者 而 言 ， 表 9-1 中 的 多 数 数据 类 型 将 是 熟悉 的 (或 自 解 释 的 )。 我们 很 快 
将 更 详细 地 讨论 一 种 数据 类 型 ， 即 OBJECT IDENTIFIER 的 数据 类 型 ， 它 被 用 于 命名 对 象 。 
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# 9-1 SM 的 基本 数据 类 型 
数据 类 型 描述 
32 比特 的 整数 ， 如 ASN. 1 所 定义 ， 其 值 在 -2 和 2 -1 之 间 ( 含 端 值 ) ， 或 一 个 来 自 


可 能 的 命名 常数 值 列表 的 值 

Integer32 32 比特 的 整数 ， 其 值 在 -2 和 2” -1 之 间 ( 含 端 值 ) 

Unsigned32 无 符号 的 整数 ， 其 值 在 0 和 2” -1 之 间 ( 含 端 值 ) 

OCTET STRING | ASN.1 格式 字 节 串 ， 表示 任意 二 进 制 或 文本 数据 ， 长 度 最 多 为 65 535 字 节 
OBJECT IDENTIFIER ANS. 1 格式 ， 由 管理 指派 (结构 化 名 称 ) ， 参 见 9.3.2 节 

IPaddress 32 比特 因特网 地 址 ， 以 网 络 字 节 顺 序 

Counter32 32 比特 计数 器 ， 能 从 0 BI 2° -1 增加 ， 然 后 回归 到 0 

Counter64 64 HORE SUR 

Gauge32 | 32 比特 整数 ， 当 增加 或 减少 时 ， 它 不 能 增加 到 232 -1 以 上 ， 也 不 能 降 到 0 以 下 
TimeTicks 时 间 ， 自 某 事 件 起 计算 ， 精 度 0.01 & 

Opaque 未 解释 的 ASN. 1 字符 串 ， 用 于 回 后 兼容 





2. SMI He rae ty 

除了 基本 数据 类 型 外 ，SMI 数据 定义 语言 也 提供 了 较 高 层 的 语言 结构 。 

OBJECT-TYPE 结构 用 于 定义 被 管 对 象 的 数据 类 型 、 状 态 和 语义 。 概 括 来 说 ， 这 些 数据 
对 象 包含 了 位 于 网 络 管理 内 部 的 管理 数据 。 在 各 种 因特网 RFC 中 有 大 约 10 000 个 定义 的 对 象 
| RFC 3410 | OBJECT-TYPE 结构 具有 4 4% fa), OBJICT-TYPE 定义 的 SYNTAX 子 句 规定 了 
与 对 象 相关 的 基本 数据 类 型 。MAX-ACCESS 子 句 规定 了 被 管 对 象 是 否 能 读 、 能 与 、 能 创建 ， 
或 在 一 个 通知 中 包括 有 它 的 值 。STATUS 子 句 指出 了 该 对 象 定义 是 否 是 当前 的 和 合法 的 、 过 
时 的 〈 在 这 种 情况 下 ， 它 不 应 当 被 实现 ， 因 为 该 定义 仅 为 了 历史 原因 而 出 现 ) ， 或 不 赞成 的 
(过 时 的 ， 但 为 了 与 过 去 的 实现 互 操作 而 实现 )。DESCRIPTION 子 句 包含 有 关 该 对 象 的 人 可 
DENY CASE 3 它 是 被 管 对 象 用 途 的 文档 ， 提 供 了 实现 该 被 管 对 象 所 需 的 所 有 语义 信息 。 

作为 OBJECT-TYPE 结构 的 一 个 例子 ， 考 虑 来 自 [ RFC 4293] 的 ipSystemStatsInDeliv- 
ers 对 象 类 型 定义 。 该 对 象 定义 了 一 个 32 比特 的 计数 各 ， 用 以 跟 踊 被 管 设备 接收 到 并 成 功 
地 传递 给 较 高 层 协议 的 IP 数据 报 的 数量 。 该 定义 的 最 后 一 行 与 这 个 对 象 的 名 字 有 关 ， 这 
是 我 们 将 在 下 一 市 中 要 考虑 的 主题 。 

ijpSystemStatsInDelivers OBJECT-TYPE 

SYNTAX Counter32 
MAX-ACCESS read-only 
STATUS current 
DESCRIPTION 


"The total number of datagrams successfully 
delivered to IPuser-protocols (including ICMP). 


When tracking interface statistics, the counter 
of the interface to which these datagrams were 
addressed is incremented. This interface might 
not be the same as the input interface for 
some of the datagrams. 


Discontinuities in the value of this counter can 
occur at re-initialization of the management 
system, and at other times as indicated by the 
value of ipSystemStatsDiscontinuityTime." 

::= { ipSystemStatsEntry ‘18 } 


MODULE- IDENTITY 结构 允许 相关 的 对 象 分 组 在 一 个 “模块 ”中 。 例 如 ，[RFC 4293 | 
规定 了 用 于 定义 被 管 对 象 (包括 ipSystemStatsInDelivers) 的 MIB 模块 ， 这 些 被 管 对 象 用 于 网 
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际 协议 (IP) 和 与 之 相关 的 因特网 控制 报 文 协议 (ICMP) 的 管理 实现 。| RFC 4022] 规定 了 
HF TCP 的 MIB 模块 ，| RFC 4113] 规定 了 用 于 UDP 的 MIB 模块 .| RFC 4502] 定义 了 用 于 


RMON 远程 监视 的 MIB 模块 除了 了 包括 该 模块 中 的 被 管 对 象 的 OBJECT- TYPE 定义 ， 
MODULE-IDENTITY 结构 还 包含 了 该 模块 作者 的 联系 信息 、 最 后 更 新 的 日 期 、 修 亲历 史 和 该 
模块 的 文本 性 描述 。 举 一 个 例子 ， 考 虑 下 面 用 于 IP 协议 管理 的 模块 定义 的 例子 
ipMIB MODULE-IDENTITY 
LAST-UPDATED "2006020200002" 
ORGANIZATION "IETF IPv6 MIB Revision Team" 
CONTACT-INFO 
"Editor: 
Shawn A. Routhier 


Interworking Labs 
108 Whispering Pines Dr. Suite 235 


Scotts Valley, CA 95066 
USA 
EMail: <sar@iwl.com>" 

DESCRIPTION 
“The MIB module for managing IP and ICMP 
implementations, but excluding their 
management of IP routes. 


Copyright (C) The Internet Society (2006). 
This version of this MIB module is part of 
RFC 4293; see the RFC itself for full legal 
notices." 


REVISION "2006020200002" 

DESCRIPTION 
"The IP version neutral revision with added 
IPv6 objects for ND, default routers, and 
router advertisements. As well as being the 
successor to RFC 2011, this MIB is also the 
successor to RFCs 2465 and 2466. Published 
as RFC 4293." 


REVISION "1994110100002" 

DESCRIPTION 
"A separate MIB module (IP-MIB) for IP and 
ICMP management objects. Published as RFC 
2071..." 


REVISION "1991033100002" 

DESCRIPTION 
"The initial revision of this MIB module was 
part of MIB-II, which was published as RFC 
Lew 

::= { mib-2 48} 


NOTIFICATION-TYPE 结构 用 来 定义 由 代理 或 管理 实体 产生 的 有 关 “SNMPv2-Trap” 和 
“InformationRequest” 报 文 的 信息 ， 参 见 9.3.3 9, 该 信息 包括 了 了 文本 性 DESCRIPTION; 
何 时 发 送 这 样 的 报 文 ， 以 及 包括 在 产生 的 报 文中 的 全 列表 ; 详情 参见 | RFC 2578 |. 
MODULE-COMPLIANCE 结构 定义 了 一 个 代理 必须 实现 的 模块 中 的 被 管 对 象 集合 。AGENT- 
CAPABILITIES 结构 定义 了 代理 关于 对 象 通知 和 事件 通知 定义 的 能 力 。 


9.3.2 管理 信息 库 : MIB 


如 上 所 述 ， 管 理 信息 库 (Management Information Base, MIB) 能 被 认为 是 一 个 虚拟 信 
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EJE, EP AY Oe AT Be A A EE RY KA RS PE iA A/a i PK HEEL, 
叮 以 由 管理 实体 通过 向 代理 发 送 SNMP 报 文 来 进行 ， 而 代理 代表 管理 实体 并 在 被 管 设备 上 
执行 操作 .被 管 对 象 使 用 前 面 讨论 的 OBJECT-TYPE SMI 结构 来 定义 ， 并 使 用 MODULE- 
IDENTITY 结 构 汇 集 在 MIB 模块 (MIB Module) F. 

IETF 已 经 专注 于 对 与 路 由 融 、 主 机 和 其 他 网 络 设备 相关 的 MIB 模块 进行 标准 化 。 这 包 
括 了 有关 硬 件 的 特定 部 分 的 基本 标识 数据 及 有 关 设 备 网 络 接口 和 协议 的 管理 信息 。 到 2006 
年 ， 有 200 多 个 基于 标准 的 MIB 模块 ， 以 及 更 多 的 厂商 特定 (专用 ) 的 MIB 模块 。 对 于 所 
有 这 些 标准 ，IETF 宫 要 一 种 方法 来 标识 和 命名 标准 化 的 模块 以 及 模块 中 的 特定 被 管 对 象 ， 
IETF 没有 白手 起 家 ， 而 是 采用 了 国际 标准 化 组 织 (IO) 已 经 提出 的 一 种 标准 化 对 象 标识 
(命名 ) 框架 。 由 于 有 共有 许多 标准 化 组 织 的 绿 故 ，ISO 对 于 它们 的 标准 化 对 象 标识 框架 有 
“庞大 计划 ”， 即 标识 任何 网 络 中 的 每 个 可 能 的 标准 化 对 象 (如 数据 格式 、 协 议 或 部 分 信息 ) ， 
而 无 沦 该 对 象 是 由 哪个 网 络 标准 组 织 ( 例 如， 因特网 IETF. ISO, IEEE 或 ANSI) 、 设 备 制造 
商 或 网 络 拥 有 者 所 定义 的 。 这 的 确 是 一 个 极 高 的 目标 ! 由 ISO 采纳 的 对 象 标 识 框架 是 ASN. 1 
(抽象 语法 记 法 1) 对 象 定 义 语言 的 一 部 分 [ISO X. 680 2002 | ， 我 们 将 在 9.4 节 中 讨论 ASN. 1. 
标准 的 MIB 模块 在 这 个 匹 所 不 包 的 命名 框架 中 有 它们 目 己 的 合适 位 置 ， 如 下 面 所 讨论 . 

如 网 9-3 所 示 ， 对 象 在 ISO 命名 框架 中 以 等 级 结构 方式 进行 命名 ,注意 到 在 该 树 上 的 
每 个 分 文 点 具有 一 个 名 字 和 一 个 编码 (显示 在 圆 括号 中 ) ; 因而 该 树 中 的 任何 点 可 由 名 字 
或 编码 的 序列 所 标识 ， 它 规定 了 从 根 到 标识 树 的 那个 点 的 路 往 。 一 个 有 趣 的 (但 不 完整 和 
非 正 式 的 ) 基于 Web 的 实用 程序 能 用 于 浏览 部 分 该 对 象 标识 树 (使 用 志愿 者 提供 的 分 文 
信息 )， 有 关 信 息 人 能 在 | OID Repository 2012] 中 找到 . 


ITU-T (0) ISO (1) 联合 ISO/ITU-T (2) 
标准 0) ISO 成 员 组 织 (2) ISO 认同 的 成 员 组 织 (3) 
美国 国防 部 (6) 开放 软件 NATO 认 同 的 


基金 会 ‘22) 成 员 组 织 (57) 


因特网 (1) 


目录 (1) 管理 (2) 实验 (3) 专用 (4) 安全 (5) snmv2 (6) 邮件 (7) 
MIB-2 (1) 
| | | | | | | | | | | | 
system interface address ip icmp tep udp egp cmot transmission smp rmon 
(1) (2) translation (4) (5) (6) (7) (8) (9) (10) (11) (16) 
(3) 


图 9-3 ANS. 1 对 象 标 识 树 
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在 该 等 级 结构 顶部 是 ISO. 和 国际 电信 联盟 的 电信 标准 化 组 织 (ITU-T) ， 以 及 这 两 个 组 
组 联合 工作 的 一 个 分 支 机 构 。 这 两 个 主要 的 标准 化 组 织 共同 研究 ANS. 1。 在 这 棵 树 的 ISO 
TLF, i 它们 分 别 对 应 所 有 ISO 标准 (1.0) 和 各 个 [SO — 1 国 的 
标准 组 织 所 发 布 的 标准 (1.2)。 尽 管 没 有 在 图 9-3 中 显示 出 来 ， 但 在 ISO 成 员 组 织 (又 可 
Al 1.2) F, ei oi USA (1.2.840) ， 在 它 下 面 我 们 将 能 发 现 正 EE ANSI 和 
公司 特定 标准 的 编码 ， 其 中 包括 RSA (1. 2. 840. 11359) 和 微软 (1. 2. 840. 113556). Ei 
软 下 面 ， 我 们 能 发 现 用 于 各 种 微软 产品 的 微软 文件 格式 (1.2. 840. 113556. 4 ) , tn Word 
(1. 2. 840. 113556. 4.2) 。 但 是 我 们 现在 感 兴 趣 的 是 网 络 HR AE ARE Word 文件 ) ， 因 此 
我 们 将 注意 力 转 回 标号 为 1.3 的 分 支 ， 这些 标准 由 ISO 认可 的 组 织 发 布 。 这 些 组 织 包 括 美 
国 国防 部 (6) (在 它 下 面 我 们 能 发 现 因特网 标准 ) 、 开 放 软件 基金 会 (Open Software 
Foundation) (22 ) 、 航 空 协 会 SITA (69) 和 北大 西洋 公约 组 织 (NATO) 认可 的 成 员 组 织 
($7) ， 以 及 许多 其 他 组 织 。 

在 该 树 的 因特网 分 支 (1.3.6.1) 下 面 ， 有 7 个 类 别 。 在 private (1.3.6.1.4) 分 支 
下 ， 列 出 了 名 字 和 专用 企业 编码 的 列表 [IANA 2009b] ， 该 列表 有 超过 几 千 个 已 经 在 因 特 
网 编号 分 配 机 构 (Internet Assigned Number Authority, IANA) 注册 的 专门 公司 [IANA 
2009a | 。 在 对 象 标识 树 的 management (1.3.6.1.2) i“ MIB-2 (1.3.6.1.21) 49a F, 我 
们 发 现 标 准 MIB 模块 的 定义 。 到达 我 们 在 ISO 名 字 空 间 的 角落 需要 经 历 多 么 漫长 的 旅 
fy Mil | 

标准 化 的 MIB 模块 

在 图 9-3 中 树 的 最 底层 显示 了 某 些 重要 的 面 问 硬件 的 MIB 模块 (system 和 interface ) 
以 及 与 某 些 最 重要 的 因特网 协议 相关 的 模块 。[ RFC 5000] Sit T A 2008 年 以 来 所 有 的 标 
准 MIB 模块 。 虽 然 阅 读 MIB 相关 的 RFC 相当 乏味 和 枯燥 ,但 考虑 一 些 MIB 模块 定义 ， 对 
认识 模块 中 的 信息 类 型 是 有 指导 意义 的 (就 像 吃 蔬 菜 对 你 映 体 有 好 处 一 样 ) 。 

位 于 system 之 下 的 被 管 对 象 包 含 了 有 关 被 管 设备 的 一 般 性 信息 ; 所 有 被 管 设备 必须 文 
持 system MIB 对 象 。 表 9-2 定义 了 system 组 中 的 对 象 ， 这 些 对 象 由 [RFC 1213] 所 定义 ， 
R 9-3 定义 了 在 一 个 被 管 实体 中 用 于 UDP 协议 的 MIB 模块 中 的 被 管 对 象 。 


表 9-2 在 MIB-2 system 组 中 的 被 管 对 象 


对象 标 识 符 AF 类 型 “描述 ( 引 自 RFC 1213) 
名 和 版 本 标识 ” 
1.3.6.1.2.1.1.2 sysObjectID OCTET IDENTIFIER 分 配给 厂商 的 对 象 ID,“ 它 提供 了 一 种 易于 操作 和 无 
二 义 性 的 方法 以 决定 被 管理 的 “单元 的 类 型 "" 
1.3.6.1.2.1.1.3 sysUpTime TimeTicks “月 系统 的 网 络 管理 部 分 最 后 被 重新 初始 化 以 来 的 时 
间 (精度 为 0.01 Fb)” 
1. 3. 6. 1. 2. 1. 1.4 sysContact OCTET STRING “该 被 管 结 点 的 联系 人 ， 以 及 关于 该 人 联系 方式 的 信息 ” 
1.3.6.1.2.1.1.5 SysName OCTET STRING “为 该 结 点 正式 分 配 的 名 字 。 按 惯例 ， 这 昨 该 结 点 的 
全 称 域名 ” 
1.3.6.1.2.1.1.6 SysLocation OCTET STRING “该 结 点 的 物理 位 置 " 
1.3.6.1.2.1.1.7 sysServices Integer32 “指出 在 该 结 点 可 用 的 服务 集合 的 编码 值 : 物理 的 


(如 一 个 转发 器 ) ， 数 据 链 路 / 子 网 〈 如 网 桥 ) ， 央 特 网 
(an IP RIX), malia (WEHL, 应 用 程序 
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R 9-3 Æ MIB-2 UDP 模块 中 的 部 分 被 管 对 象 
İRK 名 字 类 型 四 描述 ( 引 自 RFC 4113) 
1.3.6.1.2.1.7.1 udpiInDatagrams Counter32 EAT ee UDP 用 户 的 UDP 数据 报 总 g” 
1.3.6.1.2.1.7.2 udpNoPorts Counter32 fe Sse He ae RETAS EI a sag i Pe Ey LDP 
数据 报 总 数 ” 
1. 3.6.1.2.1.7.3 udpInErrors Counter32 “ 控 收 的 不 能 传递 的 UDP 数据 报 数 全 、 其 原 轩 证 非 
是 目的 地 端口 没有 应 用 程序 ” 
1.3.6.1.2.1.7.4 udpOutDatagrams Counter32 “从 该 实体 发 送 的 UDP 数据 报 总 数 ” 


9.3.3 SNMP 协议 运行 和 传输 映射 


简单 网 络 管理 协议 版 本 2 


(SNMPv2) 


| RFC 3416 | 用 于 管理 实体 和 代表 管理 实体 执行 的 


代理 之 间 传 递 MIB 信息 。SNMP 的 最 党 使 用 a ot 是 请 SRM i ( request- response mode ) , 
其 中 SNMPv2 管理 实体 向 SNMPv2 代理 发 送 一 个 请 求 . 代理 接收 到 该 请 求 后 ， 执 行 某 些 动作 ， 
然后 器 该 请 求 发 送 一 个 回答 ， 请 求 通常 用 Wi 和 恰 索 ) 或 修改 Ci) 与 某 被 管 设备 相 
KAY MIB 对 象 值 。 第 二 个 常 使 ) glee 是 代理 回 管理 实体 发 送 的 一 种 非 请 求 报 文 ， 该 
报 文 称 为 陷阱 报 文 (trap message), 该 报 文 用 于 通 各 管理 实体 ， 一 个 寞 第 情况 已 经 于 致 J 
MIB 对 象 值 的 改变 我们 在 9.1 se 网 络 管理 员 在 出 现 如 下 情况 时 可 能 希望 接收 到 
陷阱 报 文 ， 例 如 ， 一 个 接口 不 工作 ， 某 链 路 上 的 拥塞 达到 一 个 预定 的 级 别 ， 或 发 生 了 某 些 其 他 
值得 注意 的 事件 ,注意 到 在 轮 询 (请求 响应 交互 ) 和 陷阱 之 间 有 许多 折 ye 参见 课 后 习题 


表 9- 4 中 表示 T. SNMPv2 E 
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(PDU). 图 9-4 显示 了 这 些 PDU 的 格式 ， 
表 9-4 SNMPv2 PDU 类 型 

SNMPv2 PDU 类 型 发 送 方 -接收 方 描述 

GetRequest 管理 者 到 代理 取得 -个 或 多 个 MIB 对 象 实例 信 
GetNextRequest 管理 者 到 代理 取得 列表 中 下 MIB 对 象 实例 值 
GetBulkRequest 管理 皮 到 代理 DLA RBE Jr AE, Aan A AAS fE 
InformRequest 管理 者 到 管理 者 向 不 能 访问 的 远程 管理 实体 通知 MIB 值 
SetRequest 管理 者 到 代理 设置 一 个 或 多 个 MIB 对 象 实例 的 全 

Response 代理 到 管理 者 或 管理 者 zx GetRequest GetNextRequest GetBulkRequest . 

#1] FF FE OP setRequest PDUs{InformRequest,;™ +j: (i) ifn} hy 
SNMPv2-Trap 代理 到 管理 者 向 管理 者 通知 -个 异常 事件 
Get/Set 首 部 Get/Set 的 变量 
三 一 一 en ey ee i ~- -一 一 -人 一 — ha 
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e GetRequest, GetNextRequest 和 GetBulkRequest PDU 都 是 管理 实体 回 代 理发 送 的 ， 以 
请 求 位 于 该 代理 所 在 的 被 管 设备 中 的 一 个 或 多 个 MIB 对 象 值 。 其 值 被 请 求 的 MIB 对 
象 的 对 象 标 识 符 定义 在 该 PDU 的 变量 绑 定 部 分 ， GetRequest , GetNextRequest 和 
GetBulkRequest 的 差异 在 于 它们 的 数据 请 求 粒度 。GetRequest 能 够 请 求 MIB 但 的 任意 
集合 ; 多 个 GetNextRequest 能 用 于 顺序 地 旋 取 MIB 对 象 的 序列 或 表 ; GetBulkRequest 
允许 谈 取 大 块 数据 ， 能 够 避免 因 发 送 多 个 GetRequest 或 GetNextRequest 报 文 可 能 导 
致 的 额外 开销 。 在 所 有 这 三 种 情况 下 ， 代 理 用 包括 该 对 象 标识 待 和 它们 相关 但 的 
Response PDU 进行 啊 应 。 
© SetRequest PDU 是 管理 实体 用 来 设置 在 被 管 设备 中 的 一 个 或 多 个 MIB 对 和 象 值 的 。 
代理 用 带 有 “无 错 (noError) ”差错 状态 的 Response PDU 来 回答 ， 证 实 该 值 的 确 
已 经 被 设置 。 
e InformRequest PDU 是 一 个 管理 实体 用 来 通知 男 一 个 管理 实体 的 ， 其 中 MIB 信息 是 接 
收 实体 不 能 访问 的 。 该 接收 实体 用 市 有 “无 错 (nokrror)” 差 错 状 态 的 Response 
PDU 来 确认 收 到 InformRequest PDU , 
e SNMPv2 PDU 的 最 后 一 种 类 型 是 陷阱 报 文 ， 陷阱 报 文 是 异步 产生 的 ， 即 它们 不 有 是 
为 了 啊 应 接收 到 的 请 求 而 产生 的 ， 而 是 为 了 响应 管理 实体 所 需要 的 通知 事件 而 产 
生 的 。RFC 3418 定义 了 周知 的 陷阱 类 型 ， 其 中 包括 设备 进行 的 冷 司 动 或 热 司 动 ， 
链 路 的 从 故障 状态 变 为 工作 状态 或 相反 ， 找 不 到 相 邻 设备 ， 或 鉴别 失效 事件 。 接 
收 到 的 陷阱 请 求 不 要 求 从 管理 实体 得 到 啊 应 。 
给 出 了 SNMPv2 请 求 啊 应 性 质 后 ， 注 意 到 尽管 SNMP PDU 能 够 通过 许多 不 同 的 运输 攻 
议 传 输 ， 但 SNMP PDU 通常 还 是 在 UDP 数据 报 的 负载 中 传输 的 。 事 实 上 ，RFC 3417 认为 
UDP 是 “首选 的 运输 映射 ” 。 由 于 UDP 是 一 种 不 可 靠 的 运输 协议 ， 因 而 不 能 确保 一 个 请 求 
或 它 的 响应 将 能 够 被 它 的 目的 地 接收 到 。 管理 实体 用 该 PDU 的 “请 求 ID” 字 段 为 它 回 代 
理发 送 的 请 求 编号 ; 代理 的 响应 从 接收 到 的 请 求 中 获取 该 “请 求 D”. 因此， 该 “请 求 
ID” 字 段 能 被 管理 实体 用 来 监测 丢失 的 请 求 或 回答 。 如果 在 一 定量 时 间 后 还 没有 收 到 对 应 
的 响应 ， 由 管理 实体 来 决定 是 否 重 传 一 个 请 求 。 特 别 是 ，SNMP 标准 没有 强制 任何 特殊 的 
重 传 过 程 ， 哪 怕 首 先进 行 了 重 传 。 它 只 是 要 求 管 理 实体 “需要 根据 重 传 的 频率 和 周期 可 徘 
地 动作 ”。 这 当然 让 人 们 想 知 道 一 个 “可 徘 的 ”协议 行为 应 当 如 何 去 做 ! 


9. 3.4 安全 性 和 管理 


SNMPv3 的 设计 者 们 说 过 “SNMPv3 能 被 看 成 是 具有 附加 的 安全 性 和 管理 能 力 的 
SNMPv2” [ RFC 3410]。SNMPv3 比 起 SNMPv2 来 无 疑 有 一些 变 化 ， 但 是 其 他 地 方 的 变化 都 没 
有 管理 和 安全 性 领域 的 变化 那么 明显 。 在 SNMPv3 中 安全 性 的 重要 性 尤为 突出 ， 因 为 缺乏 安 
全 性 导致 SNMP 只 能 用 于 监视 而 不 能 用 于 控制 (例如 ， 在 SNMPv1 中 很 少 使 用 SetRequest ) 。 

SNMP 经 历 了 3 个 版 本 后 已 经 成 熟 ， 它 的 功能 有 了 增加 ， 但 不 症 的 是 ,与 SNMP 相关 
的 标准 文档 的 数量 增加 了 。 这 能 够 由 下 述 事实 来 印证 : 现在 甚至 有 了 “ 摘 述 用 于 摘 述 
SNMP 管理 框架 的 体系 结构 的 RFC” [RFC 3411]! 虽然 描述 一 个 框架 的 体系 结构 这 个 概念 
也 许 使 人 有 些 不 太 好 理解 ， 但 RFC 3411 的 目的 是 值得 肯定 的 ， 它 引信 了 一 种 共同 语言 ， 
用 于 描述 功能 和 由 SNMPv3 代理 或 管理 实体 所 采取 的 动作 。SNMPv3 实体 的 体系 结构 是 简 
单 明 了 的 ， 浏 览 该 体系 结构 将 有 助 于 我 们 进一步 理解 SNMP, 
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所 谓 SNMP 应 用 程序 (SNMP application) 是 由 命令 产生 人 各、 通知 接收 大 和 代理 转发 
fit ( 这些 通常 位 于 管理 实体 中 )、 命 令 响 应 费 和 通知 源 发 各 (这 两 者 通常 位 于 代理 中 ) 以 
及 其 他 可 能 的 应 用 程序 组 成 的 -命令 产生 如 产生 我 们 在 9.3.3 WT ea AY GetRequest , 
GetNextRequest 、GetBulkRequest 和 SetRequest PDU， 并 人 处理 对 这 些 PDU 接收 到 的 啊 应 . A 
令 啊 应 各 在 代理 中 执行 ， 接收 、 处 理 和 “(用 Response 报 文 ) 回答 接收 到 的 GetRequest、 
GetNextRequest 、GetBulkRequest 和 SetRequest PDU, 代理 中 的 通知 源 发 希 应 用 程序 产生 
Trap PDU; 这 些 PDU 最 终 由 管理 实体 中 的 通知 接收 大 应 用 程序 接收 和 处 理 . IREE A Ai 
应 用 程序 转发 请 求 PDU、 通 知 PDU 和 响应 PDU 

由 SNMP 应 用 程序 发 送 的 PDU 在 经 过 适当 的 运输 协 以 发 送 之 前 ， 接 下 来 通过 SNMP 
“引擎 ”传递 。 图 9-5 显示 了 由 命令 产生 器 应 用 程序 产生 的 一 个 PDU 先进 入 调度 模块 ， 在 
那里 决定 SNMP 的 版 本 。 然 后 该 PDU 在 报 文 处 理 系统 中 进行 处 理 ， 在 这 里 该 PDU BAT 
在 包括 SNMP 版 本 号 、 报 文 ID 和 报 文 长 度 信息 的 报 文 首 部 中 。 如 末 需 要 加 密 或 鉴别 ， 还 
要 包括 针对 这 些 信 息 的 适当 首部 字段 信息 ; 详 见 [RFC 3411]. 最 后 ，SNMP 报 文 〈《 应 用 
程序 产生 的 PDU 加 上 首部 信息 的 报 文 ) 被 传递 到 适当 的 运输 协议 ， 携 市 SNMP 报 文 的 首 
选 运输 协议 是 UDP (EI SNMP 报 文 被 作为 UDP 数据 报 的 负载 传送 ) ， 用 于 SNMP 的 首选 闹 
口号 是 端口 161。 端口 162 用 于 陷阱 报 文 。 


命令 生成 加 通知 接收 器 代理 转发 
imi 


SNMP 


E paces 
pee 命令 响应 器 通知 源 发 器 | | 其 他 | 








| | 
时 间 安排 ， | Fea] Hs 
eB, M none | 








图 9-5 SNMPv3 引 敬 和 应 用 程序 


前 面 我 们 已 经 看 到 SNMP 报 文 不 仅 能 用 于 监视 ,也 能 用 于 控制 (例如 ， 通 过 
SetRequest 命令 ) 网 络 元 素 。 显 然 ， 硅 一 个 人 侵 者 能 够 截获 SNMP 消息 和 /或 产生 它 上 自己 
的 SNMP 报 文 并 回 管理 基础 设施 发 送 ， 它 就 可 能 会 对 网 络 造成 损害 。 因 此， 安全 地 传输 
SNMP iR MHRPKBBAN. SAAN AL, ME SNMP 最 近 的 版 本 中 ， 安 全 性 才 得 到 应 
有 的 注意 。SNMPv3 的 安全 性 被 称 为 基于 用 户 的 安全 性 (user-based security) [| RFC 
3414 | ， 这 是 因为 它 应 用 了 用 户 的 传统 概念 〈 用 户 采 用 用 户 名 来 标识 ) ， 还 有 相关 的 口 
令 、 密 码 值 或 访问 权限 等 安全 信息 。SNMPv3 提供 了 加 密 、 鉴 别 、 对 重 放 攻击 的 防护 
(参见 8.3 47) 和 访问 控制 功能 。 
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© 40%. SNMP PDU 能 够 使 用 密码 分 组 链接 模式 的 数据 加 密 标 准 (DES) 进行 加 密 。 
注意 到 因为 DES 是 一 个 共享 密 钥 的 系统 ， 故 用 户 用 于 加 密 数 据 的 密 钥 必须 被 要 对 
该 数据 解密 的 接收 实体 所 知道 ， 

e 鉴别 。SNMP 使 用 了 报 文 鉴别 码 (MAC) 技术 ， 以 提供 鉴别 并 保护 数据 不 受 算 改 
[ RFC 4301 ] ， 其 中 的 MAC 我 们 已 在 8. 3.1 节 中 学 习 过 。 前 面 讲 过 MAC 要 求 发 送 
方 和 接收 方 都 知道 一 个 共同 的 密 钥 。 

e 对 重 放 攻 击 的 防护 ,在 第 8 章 中 我 们 讨论 了 不 重 数 能 被 用 于 防护 重 放 攻击 。 
SNMPv3 采用 了 相关 方法 ， 为 了 确保 一 个 接收 的 报 文 不 是 某 个 先前 报 文 的 重 放 ， 该 
接收 方 要 求 发 送 方 在 每 个 报 文中 包括 一 个 基于 接收 方 中 的 计数 器 的 值 。 该 计数 需 
的 功能 与 不 重 数 相同 ， 反 映 了 自 接收 方 的 网 络 管理 软件 最 后 一 次 局 动 以 来 的 时 间 
和 自 接收 方 的 网 络 管理 软件 最 后 一 次 配置 以 来 启动 的 总 数 。 只 要 在 接收 报 文中 的 
计数 器 位 于 接收 方 的 实际 值 的 某 种 错误 容 限 内 ， 该 报 文 被 认为 是 非 重 放 攻 击 的 报 
文 ， 此 时 它 已 被 鉴别 和 /或 加 密 。 详 见 [RFC 3414]. 

© 访问 控制 。SNMPv3 提供 了 一 种 基于 视图 的 访问 控制 [RFC 3415 ] ， 该 方法 控制 了 
哪些 网 络 管理 信息 能 被 哪些 用 户 查询 和 /或 设置 。 一 个 SNMP 实体 在 本 地 配置 库 
(Local Configuration Datastore, LCD) 保留 了 有 关 访 问 权 限 和 策略 的 信息 。LCD 的 
某 些 部 分 自身 可 作为 被 管 对 象 访问 ， 在 基于 视图 访问 控制 模型 配置 MIB 中 定义 
| RFC 3415], ， 并 因此 能 够 经 SNMP 从 远程 进行 管理 和 操作 。 


9.4 ASN. 1 


在 本 书 中 ， 我 们 已 经 涉及 了 一 些 计算 机 网 络 的 有 趣 主题 。 然 而 ， 本 节 有 关 ASN. 1 的 
内 容 或 许 算 不 上 前 10 个 有 趣 的 主题 。 像 蔬菜 有 益 于 健康 一 样 ， 有 关 ASN. 1 的 知识 和 表示 
服务 的 更 广泛 问题 是 对 你 有 益 的 东西 。ASN. 1 是 一 种 源 于 ISO 的 标准 ， 用 于 一 些 因 特 网 相 
关 的 协议 中 ， 特 别 是 用 于 网 络 管理 领域 中 。 例 如 ， 我们 在 9. 3 市 中 看 到 ，SNMP 中 的 MIB 
变量 与 ASN. | 有 不 解 之 缘 。 尽 管 ASN. 1 的 有 关 资 料 可 能 相当 枯燥 ， 但 我 们 和 布 望 读者 能 够 
认识 到 这 些 相 关 材 料 的 重要 性 . 

为 了 激发 我 们 下 面 的 讨论 ， 这 里 考虑 下 列 可 能 的 实验 。 假 定 一 个 人 能 够 可 靠 地 将 数据 
从 一 台 计 算 机 的 内 存 直 接 复制 到 远程 另 一 台 计 算 机 的 内 存 中 。 如 果 他 能 够 这 样 做 ， 其 中 的 
通信 问题 将 是 如 何 解 决 的 ? 该 问题 的 答案 取决 于 他 对 “通信 问题 ”的 定义 。 毫 无 疑问 ， 一 
个 完善 的 内 存 到 内 存 复制 将 是 从 一 台 机 器 到 另 一 台 机 器 的 比特 和 字 节 的 精确 通信 。 当 在 接 
收 计 算 机 上 运行 的 软件 存 取 这 些 数据 时 ， 这 些 比 特 和 字 节 的 实际 复制 意味 着 什么 ”我 们 能 
够 看 到 与 在 发 送 计算 机 内 存 中 所 存储 的 一 样 的 值 吗 ?” 对 该 问题 的 答案 是 “不 一 定 ”! 该 问 
题 的 症结 在 于 ， 不 同 的 计算 机 体系 结构 、 不 同 的 编译 程序 具有 不 同 的 存储 和 表示 数据 的 党 
规 方法 。 如 果 数 据 要 通信 ， 或 在 多 台 计 算 机 中 存储 (因为 数据 在 各 通信 网 络 中 ) ， 显 然 必 
须要 解决 数据 表示 的 问题 。 

作为 该 问题 的 一 个 例子 ， 考 虑 下 面 简 单 的 C 代码 段 。 这 个 结构 怎样 在 内 存 中 安排 呢 ? 


Struct 4 
char code; 


test.code = ʻa'; 


514 Zot 


网 9-6 的 左 侧 显 示 了 了 该 数据 在 一 种 假想 的 体系 结构 中 的 一 种 可 能 的 内 存 安排 : 在 一 个 
单字 节 内 存 中 包含 了 字符 “a”， 其 后 的 16 比特 的 字 包 含 了 整数 值 239， 以 高 阶 字 节 在 先 
的 顺序 存储 。 在 另 一 台 计 算 机 中 的 内 存 安 排 显示 在 图 9-6 的 右 侧 。 字 符 “a” 后 面 是 16 比 
特 的 整数 值 ， 以 低 阶 字 节 在 先 的 顺序 存储 ， 它 们 以 16 比特 的 字 为 边界 对 齐 。 当 然 ， 如 果 
某 人 在 这 两 台 机 器 的 内 存 之 间 执 行 逐 字 复 制 ， 使 用 相同 的 结构 定义 来 存 取 存 储 的 值 ， 他 将 
在 这 两 台 计 算 机 上 看 到 极为 不 同 的 结果 ! 


test .code a test.code a 
test.x 00000001 
00000011 test.x 00000011 
00000001 


图 9-6 两 种 不 同体 系 结构 上 的 两 种 不 同 的 数据 安排 


不 同 的 体系 结构 有 具有 不 同 的 内 部 数据 格式 ， 这 是 一 个 真实 而 普遍 的 问题 。 以 不 同 的 形 
式 存储 整数 的 特定 问题 非常 常见 ， 并 且 有 了 一 个 专 有 名 称 。 用 于 存储 整数 的 “大 端 法 ” 
(big-endian) 次 序 要 求 最 高 阶 字 证 先 存 储 (在 最 低 的 存储 地 址 ) ， “小 端 法 ” (little-endian) 
次 序 要 求 先 存 储 最 低 阶 字 节 。Sun SPARC 和 Motorola 处 理 器 采用 “大 端 法 ”， 而 Intel 和 
DEC/Compag Alpha 处 理 器 采用 “小 端 法 ”。 作 为 一 个 小 插曲 提 一 下 ， 术 语 “big-endian” 
和 “lite-endian” 来 目 Jonathan Swift 的 书 《 格 列 佛 游记 》， 书 中 的 两 群 人 固执 己见 地 坚持 
以 两 种 不 同方 式 做 一 件 简 单 的 事情 (希望 对 计算 机 体系 结构 方面 的 这 个 类 比 有 助 于 理解 ) . 
来 日 小 人 国 的 一 群 人 坚持 在 较 大 一 端 打开 鸡 入 (“大 端 法 ”) ， 而 其 他 人 坚持 在 较 小 一 端 打 
开 鸡 重 。 这 个 分 收 导 致 了 大 规模 民事 冲突 和 叛乱 。 

既然 存在 不 同方 式 的 计算 机 存储 和 数据 表示 ， 网 络 协议 该 怎样 处 理 这 些 问题 呢 ? 例 
如 ， 如 果 一 个 SNMP 代理 打算 发 送 一 个 啊 应 报 文 ， 其 中 包含 接收 到 的 UDP 数据 报 数量 的 整 
数 计数 需 的 值 ， 它 怎样 表示 将 加 管理 实体 发 送 的 该 整数 值 呢 ?7 是 以 大 端 法 还 是 以 小 端 法 次 
序 呢 ? 代理 的 一 种 选择 是 以 在 管理 实体 中 存储 的 相同 顺序 来 发 送 这 些 字 节 。 另 一 种 选择 是 
代理 以 目 己 的 仓储 顺序 发 送 ， 并 让 接收 实体 根据 需要 重新 排序 。 任 何 一 种 选择 都 将 要 求 发 
送 方 或 接收 方 知 道 其 他 人 的 整数 表示 格式 。 

第 三 种 选择 是 用 与 机 需 无 关 、03 无 和 天、 语言 无 关 的 方式 描述 整数 和 其 他 数据 类 型 
( 即 一 种 数据 定义 语言 ) 和 规则 ， 该 规则 定义 了 每 种 数据 类 型 跨越 网 络 传输 的 方式 。 当 接 
收 到 给 定 类 型 的 数据 时 ， 它 以 一 种 已 知 格式 来 接收 ， 并 能 以 任意 机 需 特 定 的 格式 进行 存 
储 。 我 们 在 9. 3 市 中 学 习 的 SMI Al ASN. 1 都 采用 了 第 三 种 选择 。 用 ISO 术语 来 说 ， 这 两 个 
标准 描述 了 一 种 表示 服务 (presentation service), ， 该 服务 用 于 将 信息 从 一 种 机 器 特定 格式 
传输 和 转换 到 另 一 种 机 需 特 定格 式 。 图 9-7 阐述 了 一 个 真实 世界 中 的 表示 问题 ; 两 个 接收 
方 者 不 理解 交流 的 基本 思想 ， 如 谈话 者 喜欢 的 东西 。 如 图 9-8 所 示 ， 一 个 表示 服务 能 够 解 
决 该 问题 的 过 程 是 ， 通 过 将 思想 转换 成 共同 理解 的 (通过 表示 服务 )、 与 个 人 无 关 的 语言 ， 
回 接收 方 发 送 该 信息 ， 然 后 转换 成 接收 方 能 理解 的 语言 。 

表 9-5 显示 了 一 些 ASN. 1 定义 的 数据 类 型 。 前 面 我 们 在 学 习 SMI 时 已 遇 到 了 INTEGER, 
OCTET STRING 和 OBJECT IDENTIFIER 数据 类 型 。 这 里 我 们 的 目标 不 是 提供 对 ASN. 1 的 
元 整 概 述 ， 因 此 我 们 向 读者 推荐 描述 ASN. 1 类 型 和 结构 的 标准 或 已 出 版 的 和 在 线 的 书籍 
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| Larmouth 1996 |. 这 些 结构 如 SEQUENCE 和 SET， 它们 可 用 于 定义 结构 化 的 数据 类 型 . 
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图 9-8 表示 问题 的 解决 


除了 提供 数据 定义 语言 ，ASN. 1 也 提供 基本 编码 规则 (Basic Encoding Rules, BER), 
BER 定义 了 采用 ASN. 1 数据 定义 语言 所 定义 的 对 象 实例 经 由 网 络 发 送 的 方式 。BER 采用 
一 个 所 谓 TLV (Type, Length, Value) 方法 (TLV approach) 对 发 送 的 数据 进行 编码 。 对 
于 被 发 送 的 每 个 数据 项 ， 将 以 该 数据 项 的 数据 类 型 、 长 度 以 及 它 的 实际 值 的 顺序 进行 发 
送 。 对 于 这 个 简单 的 规则 ， 接 收 的 数据 基本 上 是 目标 识 的 . 


表 9-5 部 分 ASN. 1 数据 类 型 






l 值 为 “ 真 ”或 “ 假 ” 
3 -个 或 多 个 比特 的 列表 

4 OCTET STRING -个 或 多 个 字 节 的 列表 

: Kit 

6 名 字 ， 位 于 ASN. 1 标准 命名 树 上 ， 参 见 9. 2. 2 节 


516 # 9# 


图 9-9 显示 了 如 何 发 送 两 个 数据 项 的 一 个 商 单 例子 PAFF, BERHAK mA 
顺序 ， 发 送 方 要 发 送 字 符 果 “smith” Fm 640 MEAM OE Fe 
00000001 00000011， 或 值 为 1 的 一 个 字 市 后 跟 值 为 3 WSE T). pashan enol 
个 字 节 具有 值 4， 指 出 后 面 的 数据 项 的 类 型 是 OCTET STRING; wit eat 编码 中 的 “T” 
UPER PS NART OCTET STING HERE, ATA e lh 
字 节 开始 了 长 度 为 5 的 OCTET STRING; CEE TT py ASCH 表示 。 下 个 数据 项 的 


T, LÆ V 的 值 是 2 (INTEGER 类 型 标志 值 )、2 ( 即 ne ST A — SO) 和 十 进 制 
WX 259 AY 2 ZERRAK o 


lastname: :=OCTET STR Tt = © “ fweight,259} 
“weight: =INTEGER — _ {lastname, “smith” } 


RASNI ER 模块 中 定义 
的 数据 类 型 的 数据 类 型 
声明 的 模块 的 实例 


ER 





nm ob 


传送 的 字 节 流 


me 


+ A 


图 9-9 BER 编码 例子 


在 以 上 的 讨论 中 ， 我 们 仅仅 接触 了 ASN. 1 的 少 而 简单 的 内 容 。 如 要 学 习 更 多 ASN. 1 ， 
可 参考 的 资料 包括 ASN. 1 标准 文档 | ISO X. 680 2002 | 、 在 线 OSI 相关 书籍 | Larmouth 
2012] 和 ASN. 1 相关 的 Web 站 点 [OSS 2012] 和 [OID Repository 2012 | 。 


9.5 小 结 


我 们 对 网 络 管理 以 及 所 有 与 网 络 有 关 的 内 容 的 学 习 现 在 已 经 结束 ! 

在 有 关 网 络 管理 的 最 后 一 曹 中， 我 们 以 需求 为 动机 ， 为 网 络 管理 员 提 供 适 当 的 工具 ， 
以 监视 、 测 试 、 轮 询 、 配 置 、 分 析 、 评 估 和 控制 网 络 的 运营 。 网 络 管理 员 的 责任 是 保持 网 
oe 启动 并 运行 良好 ”。 我 们 与 复杂 系统 如 发 电厂 、 飞 机 和 人 类 组 织 的 管理 进行 类 比 ， 有 
助 于 启发 这 种 需求 。 我 们 看 到 网 络 管理 系统 的 体系 结构 围绕 5 个 关键 组 件 : (D 一 个 网 络 管 
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理 者 ; 2) 一 组 被 管 的 远程 (中 网 络 管理 者 ) 设备 ; 久 在 这 些 设备 中 包含 有 关 这 些 设备 的 状 
态 和 操作 BAT rH ELE (MIB); 由 报告 MIB 信息 并 在 网 络 管理 者 控制 下 采取 措施 的 
远程 代理 ; ‘ 引 网 络 管理 者 和 远程 设备 之 问 的 通信 协议 ， 

接着 我 们 深入 研 究 了 因特网 标准 管理 框架 的 细 市 ， 特 别 是 SNMP 协议 -我们 看 到 了 
SNMP 是 如 何 对 网 络 管理 体系 结构 的 5 个 关键 组 件 实例 化 的 ， 花 了 不 少时 间 来 研究 MIB 对 
象 、SMI (用 于 定义 MIB 的 数据 定义 语言 ) 和 SNMP 协议 本 身 。 注意 到 SMI Al ASN. 1 是 密 
不 可 分 的 ，ASN. 1 在 ISO/OSL 7 层 参 考 模型 的 表示 层 中 起 大 关 键 作 用 ， 我 们 则 简要 地 学 习 
”ASN. 1 。 也 许 比 ASN. 1 自身 细节 更 为 重要 的 是 ， 在 网 络 中 机 器 特定 数据 格式 之 间 的 转 
换 ， 尽 管 某 些 网 络 体系 结构 由 于 具有 表示 层 而 明确 声明 了 这 种 服务 的 重要 性 ， 但 在 因特网 
协议 栈 中 eels UK. 

还 值得 一 提 的 是 ， 本 书 还 有 许多 重要 的 网 络 管理 主题 我 们 没有 涉及 ， 例 如 ， 故 障 识 别 
和 管理 ， lead Ke, A RAR BF ee (例如 ， 与 网 络 管理 形成 对 
IE). 这 些 主题 虽然 重要 ,但 对 它们 的 讨论 应 当 由 专门 的 文献 来 进行 ,我们 提请 读者 参考 

1 节 中 提 到 的 文献 


课 后 习题 和 问题 


Yi 


到 复习 题 


ra 
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Rl. 为 什么 网 络 管理 员 得 盘 于 使 用 网 络 管理 醋 具 ”描述 5 种 相关 情况 ， 
R2. ISO 定义 的 网 络 管理 的 $ 个 领域 是 什么 ? 

R3. 网 络 管 理 和 服务 管理 的 主要 区 别 是 什么 ? 


9.2 节 
R4. 定义 下 列 术 语 : 管理 实体 ， 被 管 设备 ， 管 理 代 理 ，MIB， 网 络 管理 协议 。 
9.37 


RS. 网 络 管理 中 SMI 的 作用 是 什么 ? 

R6. SNMP 中 的 请 求 响 应 报 文 和 陷阱 报 文 之 间 的 重要 区 别 基 什么 ? 

R7. SNMP 中 使 用 的 7 种 报 文 类 型 是 什么 ? 

R8. “SNMP 引擎 ”的 含义 是 什么 ? 

9.4 节 

R9. ASN. 1 对 象 标 识 树 的 目的 是 什么 ? 

RIO. 在 ISO/OSI 参考 模型 的 表示 层 中 ，ASN. 1 的 作用 是 什么 ' 

R11. 因特网 有 具有 表示 层 吗 ”如 果 没 有 ， 如 何 关 注 所 涉及 的 机 比 体 系 结构 的 差异 (例如 ， 在 不 同 机 此 上 和 整 
数 的 不 同 标识 )? 

R12. TLV 编码 意味 着 什么 ? 


Pl. 考虑 在 管理 实体 和 被 第 设备 之 间 发 生 通信 的 两 种 方式 ， 清 求 响应 方式 和 陷阱 方式 。 DIF Sy TIES 
这 两 种 方式 的 优 缺 点 : (1) 开销 ; (2) 当 异 常事 件 出 现时 通知 的 时 间 ; (3) 有 关 管 理 实体 和 设备 之 
lis] FAR CY ETE - 
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P2. 在 9.3 市 中 我 们 看 到 ， 用 不 可 靠 的 UDP 数据 报 传输 SNMP 报 文 是 更 可 取 的 方式 ， 请 你 前 述 SNMP 设 
计 者 选择 UDP 而 不 是 TCP 作为 SNMP 运输 协议 的 理由 

P3. ICMP 协议 的 ASN. 1 对 象 标 识 符 是 什么 (参见 图 9-3)? 

P4. 假设 你 在 为 一 家 美国 公司 工作 ， 该 公司 奋 望 开发 自己 的 MIB 来 管理 生产 线 . 它 将 在 对 象 标 识 树 
( [K] 9-3) PPU TE h (提示 : 为 了 回答 这 个 问题 ， 你 南 机 钻研 RFC 或 其 他 文档 ,) 

P5. 9.3.2 节 讲 过 ,一 家 私营 公司 (企业) 能够 在 专用 分 支 1.3.6.1.4 下面 创建 自己 的 MIB 变量 ,假定 
IBM 公司 要 为 它 的 Web 服务 着 软件 创建 一 个 MIB, 在 1.3.6.1.4 后 面 的 下 一 个 OID 限定 词 是 什么 ? 
(为 了 回答 这 个 问题 ， 你 而 要 参考 [IANA 2009b |.) 搜索 web， 看 看 是 否 能 找到 存在 这 样 用 于 IBM 
服务 大 的 MIB 

Po. Æ TLV 编码 中 ， 为 什么 你 认为 长 度 位 于 值 之 前 (而 不 是 长 度 跟 在 值 之 后 )? 

P7. 考虑 图 9-9 | weight, 165! | lastname, “Michael” 的 BER 编码 是 什么 ” 

P8. SFE 9-9. | weight, 145! | lastname, “Sridhar”! 的 BER 编码 是 什么 ? 
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o 请 描述 在 您 职业 生涯 中 所 从 事 的 最 令 人 兴奋 的 一 两 个 项 目 。 最 大 的 挑战 是 什么 

当 我 在 AT&T 做 研究 人 员 的 时 候 ， 我 们 一 群 人 设计 一 种 新 方法 ， 用 于 管 管理 因特网 服务 提供 商 主 二 网 
中 的 路 由 选择 。 传 统 上 ， 网 络 管理 员 逐 台 配 置 路 由 需 ， 这 些 路 由 需 运 行 分 布 式 协议 以 通过 网 络 计算 出 路 
径 。 我 们 认为 如 果 网 络 管理 员 能 够 运用 基于 拓扑 和 流量 的 网 络 范围 视图 直接 控制 路 由 需 转 发 流量 的 方式 ， 
网 络 管理 将 变 得 更 为 简单 和 灵活 。 我 们 设计 并 建造 的 路 由 选择 控制 平台 (RCP) sale Hi Nada 
FEAA AT&T 主 十 计算 路 由 ， 并 且 能 够 不 加 修改 地 控制 厚 有 的 路 由 libs 对 我 而 言 ， 这 个 项 目 是 令 人 兴 
备 的 ， 央 为 我 们 有 了 一 个 另类 的 想法 、 一 个 工作 的 系统 并 且 最 终 在 一 个 运 浓 网 络 中 进行 了 实际 部 车 

。 未 来 在 网 络 管理 领域 中 您 将 预见 到 什么 变化 和 创新 ” 

不 仅仅 是 在 现 有 网 络 上 拧紧 网 络 管理 的 螺栓 ， 研 究 人 员 及 从 业 人 员 正 在 开始 设计 本 质 上 更 容易 管理 
的 网 络 。 就 像 我 们 早期 在 RCP 上 的 工作 ， 在 所 谓 软 件 定 义 网 络 (Software Defined Networking, SDN) 中 的 
主要 思想 是 运行 控制 此 ,控制 大 能 够 在 使 用 标准 协议 的 基础 交换 机 中 安 疹 低层 次 处 理 分 组 的 规则 。 这 种 
控制 葵 能 够 运行 各 种 网 络 管理 应 用 程序 ， 诸 如 动态 访问 i Hil, EMPREI, fim LPR AR Ak E 
均衡 和 能 量 高 效 网 络 等 等 。 我 相信 通过 重新 思考 网 络 设备 和 管理 它们 的 软件 之 间 的 关系 ，SDN IAK Fi 
底 搞 清 网 络 管理 的 机 会 

o 您 认为 网 络 的 未 来 以 及 因特网 的 路 在 何方 ? 

网 络 是 一 个 令 人 兴奋 的 领域 ， 因 为 应 用 和 支撑 技术 一 直 都 在 改变 ,我们 总 是 在 改造 日 己 ! 有 谁 在 其 
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至 5 年 或 10 年 前 能 预测 到 智能 手机 主宰 的 局 面 ， 人 允许 移动 用 户 接 人 现 有 应 用 以 及 基于 位 置 的 新 服务 呢 ? 
云 计 算 的 出 现 从 根本 上 改变 了 用 户 和 他 们 所 运行 的 应 用 之 间 的 关系 ， 联 网 的 传 感 硕 能 够 使 大 量 的 新 型 应 
用 成 为 可 能 。 创 新 的 步伐 真正 残 狂 人 心 。 

基础 网 络 是 所 有 这 些 创新 的 要 素 。 的确， 网 络 是 众所周知 的 “绊脚石 ”"， 即 限制 性 能 、 降 低 可 徘 性 、 
限制 应 用 以 及 使 服务 的 部 署 和 管理 复杂 化 。 我 们 应 当 使 未 来 的 网 络 吉 着 如 同 我 们 呼吸 的 空气 一 样 不 可 见 
的 方向 进行 努力 ， 这 样 它 就 决 不 会 阻碍 新 的 思想 和 有 价值 的 服务 了 。 为 了 做 到 这 一 点 ,我 们 需要 在 网 络 
设备 和 协议 (以 及 随 之 而 来 的 首 字母 缩写 间 ) 之 上 提升 抽象 水 平 ， 使 得 我 们 能 够 将 网 络 作为 一 个 整体 来 

© 什么 人 启发 您 的 职业 灵感 ? 

长 期 以 来 ， 我 在 国际 计算 机 科学 学 会 (International Computer Science Institute) 受到 Sally Floyd 的 局 
迪 。 她 的 研究 总 是 有 明确 目标 ， 关 注 因 特 网 面临 的 重大 挑战 。 她 深入 钻研 难题 直到 完全 理解 该 问题 和 解 
空间 ， 并 且 她 将 大 量 精 力 投 入 到 “眼见 为 实 ” 中 ， 例 如 将 她 的 思想 注入 协议 标准 和 网 络 设备 中 。 此 外 ， 
她 通过 在 大 量 的 标准 和 研究 组 织 中 的 专业 服务 ， 以 及 通过 创建 工具 (如 广泛 使 用 的 ns -2 和 ns -3 模拟 
ai) 使 其 他 研究 人 员 能 够 取得 成 功 ， 而 回馈 社区 。 她 于 2009 年 退休 ， 但 她 对 该 领域 的 影响 将 持续 存在 。 

© 对 于 以 计算 机 科学 和 网 络 为 职业 的 学 生 ， 您 的 忠告 是 什么 ? 

网 络 本 质 上 是 一 个 跨 学 科 的 领域 。 将 其 他 学 科技 术 应 用 到 网 络 问题 是 推动 本 领域 回 前 发 展 的 很 好 方 
kh, 我 们 已 经 看 到 来 自 不 同 领域 的 知识 为 网 络 带 来 的 巨大 突破 ， 这 些 领 域 诸 如 排队 论 、 博 弈 论 Ehhe, 
分 布 式 系统 、 网 络 优化 、 编 程 语言 、 机 器 学 习 、 算 法 、 数 据 结构 等 。 我 认为 逐步 精通 相关 领域 ， 或 与 那 
些 领域 的 专家 密切 合作 是 一 种 为 网 络 构建 更 强大 基础 的 极 好 方式 ， 这 样 我 们 能 够 学 会 如 何 构建 值得 社会 
言 任 的 网 络 。 网 络 是 令 人 兴奋 的 领域 ， 除 了 它 是 理论 学 科 外 ， 还 因为 我 们 创造 现实 中 人 们 正在 使 用 的 实 
际 人 工 制品 。 掌 握 如 何 设计 和 建造 系统 ， 即 通过 增长 操作 系统 、 计 算 机 体系 结构 等 方面 的 经 验 ， 是 为 一 
种 增强 你 的 网 络 知识 、 进 而 改变 世界 的 了 不 起 方式 。 


BG wh 


AK URL 的 注释 。 在 下 面 的 引用 中 ， 我 们 提供 了 Web 网 页 E Web 上 有 的 文档 和 
没有 被 会 议 或 杂志 出 版 的 其 他 材料 的 URL ( 当 我 们 能 够 指出 这 些 材 料 的 位 置 时 ) ， 我 们 没 
有 提供 有 关 会 志 出 版 物 的 URL， 因 为 这 些 文档 通常 能 够 通过 如 下 方式 找到 ; 使 用 未 
个 搜索 引擎 ， 经 该 会 议 的 Web 站 点 (例如 在 所 有 ACM SIGCOMM 会 议和 专题 讨论 会 中 的 
文章 能 够 通过 pn acm. org/sigcomm 找到 )， 或 通过 订阅 数字 图 书馆 ， 尽管 到 2012 
年 1 月 ， 下 面 提供 的 所 有 URL 都 是 有 效 的 ， 但 URL 可 能 会 过 期 。 对 于 过 期 的 文献 ， 请 参 
考 本 书 的 在 线 版 本 (http://www. awl. com/kurose- ross ) | 

有 关 因 特 网 请 求 评论 (RFC) 的 注释 。 因特网 RFC 的 副本 在 多 个 网 站 上 都 可 供 使 用 . 
因特网 协会 (监管 REC pi 的 组 织 ) 的 REC 编辑 们 维护 着 网 站 http://www. rfc-editor org. 
该 网 站 允许 人 通过 标题 、 编 号 或 作者 来 搜索 某 个 特定 的 RFC 文档 ， 并 将 显示 出 对 任何 所 
Fil REC 的 更 新 。 央 特 网 REC 可 以 被 后 面 的 RFC 所 更 新 或 淘汰 ， 我 们 喜欢 的 获取 RFC ICH 
的 网 站 是 初始 REC Y, EI hitp://rfe- editor. org, 
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